شعار العنصر 14

العنصر 14، قناة يوتيوب علميّة عن تكنولوجيا الحاسوب التي نتعامل معها في حياتنا اليوميّة

كيف يقترح يوتيوب فيديوهات تناسب ذوقك؟

08/11/2019


تمهيد

أعلنت شركة نتفلكس للأفلام، ما بين عامي 2007 و 2009، عن مسابقة، قيمة جائزتها مليون دولار أمريكي. المسابقة عبارة عن بناء نظام يتوقع تقييمات المستخدمين لأفلام لم يشاهدوها. فعلى سبيل المثال، أن يتوقع النظام أن المستخدم أحمد سوف يعطي تقييم 5 (أعلى تقييم) لفيلم زهايمر.وبالتالي تتمكن نتفلكس من أن تقترح على المستخدم أحمد فيلم زهايمر، لأن النظام أو ما يسمى بال recommender system يتوقع أن الفيلم سينال إعجاب احمد. الفريق الفائز في هذه المسابقة استطاع أن يتفوق على نظام نتفلكس بنسبة 10% وكسب المليون دولار!

مقدمة

ال recommender system هو نظام يقوم بإعطاء اقتراحات للمستخدم بحيث أن تكون من ضمن اهتماماته. على سبيل المثال: يوتيوب؛ فإنه يقترح على المستخدمين مقاطع فيديو تناسب أذواقهم. وفيسبوك؛ الذي يقترح على المستخدم أصدقاء جدد أو صفحات أو مجموعات ليقوم بمتابعتها. ونتفلكس التي تقترح على مستخدميها أفلام، ومسلسلات جديدة لم يشاهدوها من قبل. وأمازون؛ الذي يقترح على مستخدميه منتجات وبضائع أملاً في بيعها، والقائمة تطول، فمثلا مواقع المواعدة تقترح شريك أو شركة ما تقترح موسيقى، كتب، أخبار، مطاعم... الخ. الاقتراحات مفيدة ماديا للشركات فمثلاً: 66٪ من الأفلام التي تمت مشاهدتها على نتفلكس مُقترحة. كذلك 35٪ من مبيعات شركة أمازون العملاقة مُقترحة. وبالتالي إذا كانت الشركة تمتلك نظام يقترح على المستخدمين أو الزبائن بطريقة تناسبهم؛ فإن مبيعات هذه الشركة سوف تزداد بشكل كبير.

التصفية التشاركية

التصفية التشاركية هي إحدى الطرق المستخدمة لبناء recommender systems لنأخذ نتفلكس كمثال خلال الشرح. ولنفرض وجود أربعة مستخدمين: أنت وعلي وسلوى ونور. وأنه يوجد لدينا أربعة أفلام مختلفة: الأرض، زهايمر، عمر المختار و عسل أسود.

فلنفرض أنك شاهدت أول ثلاثة أفلام وأن أول فيلمين حازوا على إعجابك وقمت بإعطائهم تقييماً إيجابياً، ولكن لم يعجبك الفلم الثالث، وأعطيته تقييماً سلبياً . كذلك علي: أعجبه أول فيلمين والفلم الرابع، ولم يعجبه الفيلم الثالث. وكذلك سلوى. وأخيراً نور، أعجبها الفيلمين الأول والثالث ولم يعجبها الفيلمين الثاني والرابع. نلاحظ أن علي وسلوى متشابهان حيث أنهما شاهدا الأفلام نفسها و أعطوا نفس التقييم لتلك الأفلام. ونلاحظ أيضاً أنهم يشبهونك : فأنتم الثلاثه أعجبكم فيلم الأرض، و فيلم زهايمر، ولم يعجبكم فيلم عمر المختار. السؤال الآن: من الممكن أن ينال إعجابك فيلم عسل أسود؟ وهل يقوم نتفلكس باقتراحه عليك؟ لو أننا نظرنا إلى تقييم علي وسلوى سوف نلاحظ أن عسل أسود أعجبهما ونحن تحدثنا من قبل أنك مشابه لعلي وسلوى وبالتالي يوجد احتمال كبير أن يعجبك فيلم عسل أسود. وهنا يقرر ال recommender system أن يقترح عليك فيلم عسل أسود لأنه يتوقع أن ينال إعجابك.

تجميع البيانات

أي recommender system بحاجة إلى بيانات حتى يستطيع أن يقترح. النوع الأول: بيانات يتم الحصول عليها بطريقة مباشرة من المستخدم؛ بأن يقوم بعمل تقييم مباشر لفيلم شاهده، أو منتج قام بشراءه... الخ. كما يظهر في الجدول المعروض أمامك. النوع الثاني من البيانات تكون غير مباشرة؛ مثلاً: ال recommender system يرى هل المستخدم شاهد الفيلم كله أم نصفه أم بضع دقائق فقط. إذا شاهد المستخدم الفيلم كله نستطيع أن نخمن أن الفيلم نال إعجابه. أما في حال أنه لم يشاهد سوى بضع دقائق فقط فإن ذلك يدل على أن الفيلم لم يعجبه.

التوصية بناءً على المحتوى

تحدثنا عن التصفية التشاركية، وكيف أن هذه الطريقة تعتمد على تقييمات المستخدمين، سواء حصلنا على هذه التقييمات بطريقة مباشرة أو غير مباشرة. أما النوع الثاني من الطرق لبناء recommender systems فيعتمد على المحتوى ولا يأخذ تقييمات المستخدمين بعين الاعتبار.فلنأخذ نتفلكس - التي تقترح أفلام - ولنأخذ فيلم الأرض كمثال: فإن محتوى الفيلم من الممكن أن يكون الممثلون، أو المخرج، أو النوع: (دراما أو خيال علمي ...)، أو مثلاً سنة الاصدار، الكاتب... الخ.

تمكنك هذه الطريقة من صنع تجربة خاصة لكل مستخدم، فعلى سبيل المثال: لنفرض أنك تحب أن تشاهد أفلاماً لممثل أو ممثلة معينة، فيقوم ال recommender system باقتراح أفلامه/ها عليك بعد أن يلاحظ ذلك. بالطبع هذا ينطبق على باقي الأمور مثل الملابس — هناك العديد من الأشخاص يفضلون الشراء من علامة تجارية معينة.

لنأخذ هذا المستخدم كمثال، ولنفرض أنه قام بمشاهدة فيلم عسل أسود و فيلم كدا رضا من بطولة أحمد حلمي. فالسؤال: هل نقترح عليه فيلم اكس لارج؟ الجواب نعم، ولكن لماذا؟ لأن الثلاثة أفلام من بطولة الممثل أحمد حلمي. فمن الواضح أن المستخدم يفضل مشاهدة أفلام أحمد حلمي.

Cold start

قمنا بشرح نوعين من ال recommender systems: التصفية التشاركية والتوصية بناءً على المحتوى. يعاني النوعان من مشكلة تسمى cold start، وهي أنه عند تسجيل مستخدم جديد فإن ال recommender system لا يعلم عنه شيء. ففي حالة نتفلكس، فإن ال recommender system لا يعلم ماهية الأفلام التي يفضلها، أو الممثل الذي يفضله... الخ. ففي هذه الحالة فإن ال recommender system سيقف عاجزاً عن الاقتراح على المستخدم الجديد أي شيء خاص به. أحد الحلول لهذه المشكلة يعتمد على رواج الفيلم أو الترند، فيقوم ال recommender system بالبحث عن أكثر الأفلام رواجاً ويقوم باقتراحها على المستخدمين الجدد. وكحل آخر بسيط لهذه المشكلة فإنك تلاحظ عندما تقوم بالاشتراك في نتفلكس مثلاً فإنه يسألك بطريقة مباشرة أن تختار بعض الأفلام التي قمت بمشاهدتها من قبل ونالت إعجابك.

الفقاعة

محاولة الrecommender system صنع تجربة خاصة للمستخدم تؤدي إلى مشكلة العيش داخل فقاعة: أي أن المستخدم سيشاهد الأشياء التي يفضلها فقط أو التي توافق انتمائه العرقي أو الديني أو السياسي ولن يشاهد الأشياء التي تخالفه. فمثلاً يقترح تويتر عليه متابعة أشخاص من نفس توجهه السياسي أو الديني.صممت ال news feed في فيسبوك لترتيب الأخبار التي تظهر لك من الأكثر إلى الأقل إثارة بالنسبة لك، لتحفيزك على التفاعل. والنتيجة هي أن تشاهد المشاركات والأخبار التي تناسب ذوقك ولن تشاهد ما يخالفك.

خلال الإنتخابات الأمريكية الأخيرة مثلا، بعض المحللين بناءً على بيانات من تويتر، كانوا يتوقعون أن ترامب لديه فرصة حقيقية للفوز، لكن بسبب الفقاعة التي كان يعيش فيها أنصار هيلاري كلينتون، فإنهم صدموا من النتيجة، حيث أنهم لم يشاهدوا الحسابات والحملات التي كانت تدعم ترامب وكانوا يظنون أن الجميع سوف يصوت لكلينتون.

الإعلانات

بناءً على ما سبق ذكره ، وأن ال recommender system يستطيع أن يخمن ما هي الأشياء التي تفضلها أو التي من الممكن أن تشتريها فأنت سوف تكون هدفاً للإعلانات الممولة.