برامج وأدوات
(3.6000)

تجميع وتحليل بيانات مواقع التواصل الاجتماعي

10,937 قراءة
4 تعليق
alt
التصنيف برامج وأدوات
وقت النشر
2020/12/28
الردود
4

تعتبر البيانات من أهم موارد مواقع التواصل الاجتماعي، حيث يتم تخزينها ومعالجتها وبيعها بعدة وسائل، وتختلف سياسة كل موقع عن الآخر من حيث إتاحة البيانات للباحثين. حيث تعتبر شركة فيسبوك المالكة لموقع فيسبوك وانستقرام من أكثر الشركات تعقيداً في إمكانية إتاحة الحصول على البيانات من منصاتها، ويعتبر موقع تويتر من الشبكات المفضلة لمحليي بيانات مواقع التواصل الاجتماعي لسهولة الحصول على البيانات. إجمالاً هنالك طريقتين للحصول على بيانات مواقع التواصل:


عن طريق الواجهات البرمجية (Application Programming Interfaces)

بحيث توفر بعض مواقع التواصل واجهات برمجية (يرمز لها اختصاراً APIs) تمكن الراغبين من الحصول على البيانات من منصتهم من الحصول عليها بسهولة. وتعتبر الواجهة البرمجية لموقع تويتر هي الأشهر والأكثر استخداما، لذلك سيتم التركيز عليها في هذا المقال.

هذه الواجهات متوفرة بشكل مجاني ومدفوع ولكن يجب التعامل مع أكواد برمجية بسيطة للحصول على البيانات. يوجد العديد من النصوص البرمجية الجاهزة بلغات برمجية مختلفة لتسهيل هذه المهمة مثل هذا النص البرمجي بلغة Python.

توفر تويتر واجهتين برمجيتين أساسيتين لجلب تغريدات حول وسم معين (هاشتاق) أو حول كلمات معينة (key words) أو مستخدمين. الواجهة البرمجية الأولى هي المخصصة للبث الحي المباشر (Streaming API) للتغريدات حول كلمات أو أحداث معينة، حيث يتم تحميل/جلب ما يقدر ب١٪ أو أقل (للمستخدم العادي) من التغريدات المنشورة على موقع تويتر المقدر عددها بـ ٦٠٠٠ تغريدة بالثانية تقريباً. هذا النوع من الواجهات البرمجية مناسب لمتابعة حدث، حملة، وسم (هاشتاق) يحدث بالوقت الحالي (أو عند التخطيط لحدث مستقبلي).

النوع الثاني من الواجهات البرمجية بموقع تويتر هي ال REST APIs وتستخدم للبحث التاريخي عن تغريدات حدثت بالماضي، أو لقراءة وتحميل بيانات مستخدمين محددين. ويعتبر هذا النوع مناسب للبحث الواحد المحدد عن مستخدمين محددين أو مواضيع حدثت بالماضي. فيما يلي جدول للمقارنة بين النوعين:

الواجهة البرمجية للبث الحي
Streaming API

الواجهة البرمجية للبحث التاريخي
REST API

عينة (sample) للتغريدات المنشورة حول موضوع معين، حدث معين، حسابات معينة حال حدوثها في موقع تويتر.

– البحث.
 –
أكثر المواضيع المتداولة (Trends).
 –
قراءة الملف الشخصي للمستخدم وبيانات المتابعين له/لها (followers).
 –
التغريد أو التعديل.

فقط التغريدات التي تحدث بالوقت الحالي
 (real-time data).

التغريدات الماضية (تختلف المدة الزمنية للتغريدات الماضية التي يمكن الحصول عليها باختلاف نوع حساب المطور، حيث يمكنك نوع الحساب الأساسي المجاني من الحصول على التغريدات التي تم نشرها خلال أسبوع فقط من التاريخ الحالي، ويمكنك نوع الحساب الممتاز المدفوع من الحصول على تغريدات منذ نشأة الموقع في 2006).

يشترط وجود اتصال مستمر بشبكة الإنترنت لكي يتم تحميل البيانات حال حدوثها.

يتم إرسال الطلب وتحميل جميع البيانات مرة واحدة.

ولاستخدام الواجهات البرمجية لموقع تويتر يجب التسجيل بموقع تويتر للمطورين كمطور، حيث أنه توجد ثلاثة أنواع لحسابات المطورين وهي كالتالي:

1- حساب أساسي (Standard): مجاني ويمنح المستخدم عدد محدود من الطلبات.
 2-
حساب ممتاز (Premium): قد يكون مدفوع حيث أنه يمنح المطور عدد أكبر وأوسع من الخيارات.
 3-
حساب الشركات (Enterprise): موجهه للشركات التي تتطلب الحصول على بيانات بشكل أكبر.

بعد عملية التسجيل يمكنك إتباع الخطوات الخاصة بكل واجهة برمجية، حيث أن هناك العديد من الدروس والشروحات الخاصة باستخدام هذه الواجهات، مثلهذا الدرس من جامعة أوهايومن مادة Social Media & Text Analytics.

تنويه:يقوم موقع تويتر وغيره من مواقع التواصل بتغيير مستمر على سياسة الحصول على البيانات ونموذج العمل الخاص بهم في هذا المجال، حيث أنهم على سبيل المثال قاموا مؤخراً بتغيير نموذج العمل الخاص بهم بتحديث أنواع حسابات مختلفة للمطورين والشركات وإزاحة شركة البيانات الخاصة بهم (Gnip) من الواجهة. لذلك يُنصح دائماً بمراجعة التحديثات التي تطرأ على سياسة وطرق استخدام الواجهات البرمجية.


استخدام برامج ومواقع جاهزة لجلب البيانات

الطريقة الثانية هي عن طريق استخدام برامج وأدوات بواجهات سهلة للمستخدمين لجلب البيانات. هذه الطريقة مبنية على الطريقة السابقة، حيث تم تصميم وتطوير أدوات من قبل مطورين باستخدام الواجهات البرمجية (APIs) وإتاحتها/بيعها للمستخدمين بواجهات استخدام سهلة تمكن جميع أنواع المستخدمين من استخدامها بسهولة. إيجابية هذه الطريقة هي سهولة التعامل مع واجهات البرامج، ولكن قد تكون هناك بعض القيود بعكس الطريقة السابقة. يمكن معرفة أبرز الأدوات المستخدمة عن طريق زيارة المقال هذاأيضاً يمكنك استخدام أداة Ncaptureفي برنامج التحليل النوعي الشهير NVivo لتحميل البيانات من شبكات مواقع التواصل أو من أي صفحة ويب.


طرق تحليل البيانات

هناك عدة طرق لتحليل بيانات مواقع التواصل الاجتماعي، أهمها:

  • تحليل المحتوى (Content Analysis)

هي تقنية/أسلوب (method) لفهم واستنتاج المعنى من كمية كبيرة من النصوص عن طريق إتباع طريقة تصنيف منهجية (systematic classification process). تحليل المحتوى قد تكون كمية (quantitative) أو نوعية (qualitative). تُعنى الطريقة الكمية بإحصاء مقدار أو عدد تكرار كلمة معينة أو مصطلح معين في النص، بينما تُعنى الطريقة النوعية بتصنيف البيانات لمواضيع أو أقسام (categories)؛ وقد تكون مزيج بين الطريقة الكمية والنوعية وهذا هو السائد. تحليل المحتوى هو تحليل شخصي غير موضوعي (subjective) قد ينتج عنه نتائج مختلفة عند تحليل نفس البيانات من قبل أشخاص مختلفين. لذلك عند تحليل أي محتوى يُنصح بوضع أهداف يتم التركيز عليها أثناء عملية تحليل البيانات وأسئلة يُرجى الإجابة عليها من خلال عملية تحليل البيانات وتدقيق النتائج عن طريق استخدام توثيق نسبة التوافق بين المحليين(Inter-coder reliability) . تستخدم تقنية تحليل المحتوى بشكل أساسي لتحليل النصوص، ولكن يمكن ايضاً استخدامها لتحليل الصور، المقاطع الصوتية، والفيديو.

هناك طريقتين أو أسلوبين لتحليل المحتوى:

التحليل الاستنتاجي (Deductive):حيث تقوم عملية التحليل مع وجود أقسام أو مواضيع سابقة تم استنتاجها من تحليل بيانات سابقة مشابهة (عن طريق دراسات سابقة مثلاً)، ويتم تحليل البيانات الحالية عن طريق استخدام المواضيع أو الأقسام السابقة، حيث يقوم الباحث بمطابقة البيانات الحالية بنتائج البحوث السابقة.

التحليل الاستقرائي (Inductive):حيث تبدأ عملية التحليل بدون وجود مواضيع أو أقسام متوقع وجودها في البيانات حيث يتم الوصول للأقسام أو المواضيع عن طريق استخدام البيانات الحالية بشكل كامل.

الخطوات الأساسية لتحليل البيانات عن طريق تقنية تحليل المحتوى هي كالتالي:

تجميع وتجهيز البيانات:

في هذه المرحلة يتم تجميع وتجهيز البيانات لعملية التحليل. قد يتوفر لديك عدد كبير جداً من البيانات التي لا تستطيع تحليلها كلها بشكل يدوي، لذلك يجب عليك في هذه المرحلة اختيار البيانات المراد تحليلها. قد يكون لديك أسباب معينة في عملية الاختيار بحيث تكون عينة البيانات المختارة تساعدك في الإجابة على تساؤلاتك والوصول لأهدافك من التحليل (على سبيل المثال: اختيار أوقات/تواريخ معينة للتغريدات، احتواء العينة على كلمات معينة، استهداف نوعية حسابات معينة من المغردين، وغيرها) وقد تكون عملية الاختيار عشوائية بشكل كامل.

تنظيف البيانات:

من العناصر غير المرغوب فيها. سواءً كانت تعليقات وبيانات ليس لها علاقة (noise) مثل الإعلانات وغيرها، أو من العناصر غير المرغوب فيها مثل: الموقع الجغرافي للمغرد، الصورة الشخصية، وقت التغريد، وغيرها. قد تكون هذه المعلومات مهمة لعملية تحليلك وقد تكون غير مرغوب بها. في حالة كانت هذه البيانات غير مرغوب بها، تقوم بإزالتها بهذه الخطوة.

التعرف على البيانات:

من المهم جداً قراءة البيانات ومعرفة محتواها قبل البدء بعملية التحليل لتكوين صورة مبدئية عن ماهية البيانات وما هو المحتوى المتبادل بين المستخدمين في تلك العينة.

تحديد الوحدات الرئيسية:

عند التأقلم والتعرف على البيانات بالخطوة السابقة ستلاحظ وحدات/مواضيع أساسية تم تداولها في تلك العينة. على سبيل المثال، عند تحليل بيانات عن حملات إعلانية مختلفة، قد تجد تعليقات تدور حول الممثلين وأخرى حول موسيقى الإعلان والإخراج، وأخرى حول المحتوى أو المنتج؛ فهذه قد تعتبر وحدات أو مواضيع مختلفة.

بناء مخطط الوحدات

:مع قراءة المحتوى والانغماس فيه، ستجد العديد من الوحدات والعلاقات بينها. وبعض المواضيع أو الوحدات قد تحتوي على عدة مواضيع فرعية من المواضيع الأساسية فتقوم ببناء مخطط كامل للمواضيع والمواضيع الفرعية والعلاقات فيما بينها. في هذه الخطوة تقوم بتسمية وتعريف كل قسم و تحديد ما يشمله أو لا يشمله كل قسم.

تجربة عينة من البيانات على مخطط الوحدات:

هذه الخطوة تمكنك من معرفة ما إذا كان مخطط الوحدات يغطي جميع البيانات والمواضيع بالبيانات أم لا. إذا وجدت عدم شمولية مخطط الوحدات لبعض البيانات تقوم بتعديله ليشمل البيانات.

تحليل كافة البيانات:

بعد أن تأكدنا من ملائمة مخطط الوحدات لجميع البيانات، نقوم بتحليل البيانات.

التحقق من تناسق التحليل:

في هذه الخطوة نتحقق من أننا أدرجنا نفس نوعية البيانات لنفس القسم. على سبيل المثال، إن كان هناك تغريدات تتحدث عن طريقة إخراج الإعلانات، نتحقق من أن جميع هذه التغريدات تم تصنيفها تحت نفس القسم.

استخلاص الاستنتاجات من التحليل

في هذه المرحلة وبعد أن أتممنا عملية التحليل نقوم بفهم الصورة الكاملة من البيانات التي قمنا بتحليلها وربط النتائج بمعلومات أخرى (مثال: دراسات سابقة، معلومات وإحصائيات أخرى) لربط النتائج بالعالم الاجتماعي المحيط به.

كتابة التقرير النهائي:

إن كان أحد أهداف عملية التحليل هو كتابة تقرير نهائي، نقوم بهذه المرحلة بكتابة التقرير النهائي بالنتائج والخطوات التي تم إتباعها للوصول للنتائج.

على سبيل المثال؛ عند تحليل التغريدات التالية عن ظاهرة التفحيط (القيادة المتهورة)، قمنا بجمع تغريدات تحتوي على كلمة’ تفحيط’ وسنقوم بتحليل المحتوى:


النص في التغريدة الأولى يوحي أن قيادة المراهقين هو من أهم مسببات ظاهرة التفحيط (من وجهة نظر محمد). لذلك وضعت قسم يسمى “قيادة المراهقين” ويحتوي على كل التغريدات المشابهة التي تشير لقيادة المراهقين. من وجهة “أسماء” بالتغريدة الثانية، التفحيط مسبب رئيسي للحوادث المرورية، لذلك وضعت قسم يسمى “الحوادث المرورية” تحتوي على كل التغريدات التي تشير للحوادث المرورية.

النتيجة النهائية لتحليل المحتوى تكون مشابهة للجدول التالي:


قد تحتوي عملية التحليل على مواضيع فرعية كالمثال التالي:


ملاحظات عند القيام بتحليل محتوى:
 
* اختيار الأقسام (والأقسام الفرعية) يجب أن ينبعث من أهداف التحليل والأسئلة التي يُراد الإجابة عليها ومعرفتها.
 
* الأقسام يجب أن تكون واضحة وغير متداخلة.
 
* من الطبيعي احتواء التحليل على قسم يٌدعى “أخرى” أو “غير ذلك” يحوي على البيانات التي لا تنتمي لأي من الأقسام الأخرى.
 
* يجب أن يكون هناك اسم واضح و تعريف لكل قسم بحيث يُسهل عملية التحليل، خصوصاً عند وجود أكثر من شخص يقوم بعملية التحليل.


تحليل المشاعر (Sentiment Analysis)

هذا النوع من التحليل يعني بتحليل مشاعر الناس تجاه قضايا ومواضيع، منظمات، منتجات، شركات، حملات، وغيرها. هنالك أربعة أقسام رئيسية عند تحليل المشاعر:

القسم الأول: إيجابي:هذا النوع من البيانات يظهر مشاعر إيجابية مع الموضوع الذي نقوم بتحليل البيانات تجاهه.
 
القسم الثاني: طبيعي (محايد):هذا النوع لا يظهر مشاعر إيجابية ولا سلبية تجاه الموضوع.
 
القسم الثالث: سلبي:هذا النوع يظهر مشاعر سلبية.
 
القسم الرابع: مختلط:يحتوي على مزيج من المشاعر الإيجابية والسلبية.

مثال على تحليل لمشاعر الناس حول حملة إعلانية لسيارة جديدة:

وبالمثل، يمكن أيضاً تحليل آراء الناس تجاه قضايا معينة، وهو ما يعرف بـ (Stance Identificationحيث يتم تحليل البيانات إما مع أو ضد قضية معينة. على سبيل المثال، عند تجميع عدد من التغريدات التي تدور حول إغلاق المحلات أوقات الصلاة، قيادة المرأة، قانون ضريبة القيمة المضافة، أو غيره من المواضيع، يمكن لمحلل البيانات فرز التغريدات لثلاثة أقسام رئيسية:

إيجابيمع القضية المطروحة (مثال: مع إغلاق المحلات، قيادة المرأة أو ضريبة القيمة المضافة).
 
سلبي:ضد القضية المطروحة (مثال: ضد إغلاق المحلات، قيادة المرأة أو ضريبة القيمة المضافة).
 
أخرى:لم يظهر مشاعر سواءً واضحة أو قوية لأي الطرفين.


تحليل الشبكات الاجتماعية (Social Network Analysis)

أو التحليل الشبكي، وهي طريقة لتصوير شبكة أو دائرة اجتماعية معينة عن طريق تحديد العلاقات بين المستخدمين بالدائرة ومعرفة المؤثرين بتلك الدائرة وأنواع وأشكال البيانات المنتشرة في كل دائرة أو علاقة، وطبيعة التواصل بين المستخدمين. يُستخدم هذا النوع من تحليل البيانات عند الرغبة بتسليط الضوء على الشبكة الاجتماعية ككل وديناميكيتها وليس على المحتوى فقط. يمكن استخدام عدة أدوات للمساعدة في التحليل الشبكي مثل Gephi وNodexl.


واخيراُ

هنالك العديد من الصفات والعوامل التي قد تكون مفيدة في عملية تحليل بيانات مواقع التواصل مثل الجنس، الموقع الجغرافي، الفئة العمرية وغيرها، وأهمية هذه العوامل وغيرها تُحدد من قبل أهدافنا من تحليل البيانات. أتمتة بعض عمليات تحليل البيانات (مثل تحليل المشاعر أو معرفة جنس المستخدم على سبيل المثال) تُعد من أبرز المجالات البحثية الحالية من قبل المختصين بمجال معالجة اللغات الطبيعية، ويعتبر اختلاف وتغير اللهجات وطُرق الإملاء المختلفة من أبرز التحديات بهذا المجال.


التعليقات (4)

قم بتسجيل الدخول لتتمكن من إضافة رد