تجزیه و تحلیل احساسات Vader: یک راهنمای کامل ، تجارت Algo و موارد دیگر

ساخت وبلاگ

در امور مالی و تجارت هر روز مقدار زیادی از داده ها تولید می شود. این داده ها به صورت اخبار ، انتشار برنامه ریزی اقتصادی ، ارقام اشتغال و غیره ارائه می شود. مشخص است که این خبر تأثیر زیادی در قیمت سهام دارد.

هر معامله گر تلاش های زیادی را برای پیگیری آخرین اخبار و به روزرسانی تماس های تجاری بر این اساس انجام می دهد. خودکار سازی این کار فرصت های تجاری بهتری را فراهم می کند.

در این وبلاگ ، ما می خواهیم مطالعه کنیم که تجزیه و تحلیل احساسات Vader چیست و چگونه می توان از آن در مدل های تجارت الگوریتمی خود با استفاده از پایتون استفاده کرد.

وادر چیست؟

Vader یک مدل تجزیه و تحلیل احساسات با منبع کمتری است که از مجموعه ای از قوانین برای مشخص کردن یک مدل ریاضی بدون کدگذاری صریح آن استفاده می کند. Vader در مقایسه با مدل های یادگیری ماشین منابع کمتری مصرف می کند زیرا نیازی به مقادیر زیادی از داده های آموزشی نیست.

رویکرد کارآمد منابع Vader به ما کمک می کند تا احساسات موجود در رسانه های پخش مانند متن ، صدا یا فیلم را رمزگشایی و کمیت کنیم. Vader از تجارت با سرعت کار به شدت رنج نمی برد.

Vader مخفف V alence a ware d ictionary for s e-ntiment r seasoning است.

نگران نباشید اگر این کلمات در حال حاضر برای شما معنی ندارند. در پایان این وبلاگ ، درک جدی از این کلمات خواهید داشت.

vader sentiment analysis meme

حرکت به بخش بعدی که در مورد صحت طبقه بندی مدل Vader و چگونگی دستیابی Vader به آن بحث می کند.

صحت وادر چیست؟

مطالعه نشان می دهد که Vader به اندازه رأی دهندگان انسانی در تطبیق حقیقت زمینی خوب عمل می کند.

بیشتر بازرسی از نمرات F1 (دقت طبقه بندی) ، می بینیم که وادر (0. 96) از رأی دهندگان انسانی (84/0) در برچسب زدن صحیح احساسات توییت ها به کلاسهای مثبت ، خنثی یا منفی بهتر عمل می کند.

دلیل این امر این است که وادر به هر دو قطبیت (چه احساساتی مثبت یا منفی باشد) و شدت (چقدر مثبت یا منفی احساسات) حساس است.

Vader با ارائه نمره Valence به کلمه در نظر گرفته می شود. این ما را به بخش بعدی می رساند.

نمره Valence چیست؟

این نمره ای است که با استفاده از مشاهده و تجربیات به جای منطق خالص به کلمه مورد نظر اختصاص می یابد.

  • کلمات "وحشتناک" ، "ناامید" ، "بدبخت" را در نظر بگیرید. هر انسان خودآگاه به راحتی می تواند احساسات این کلمات را منفی کند.
  • در حالی که از طرف دیگر ، کلماتی مانند "شگفت انگیز" ، "ارزشمند" ، "کافی" نشان دهنده احساسات مثبت است.

طبق مقاله دانشگاهی در مورد Vader ، نمره Valence در مقیاس ا ز-4 تا +4 اندازه گیری می شود ، جایی ک ه-4 مخفف "منفی ترین" ترین احساسات و +4 برای "مثبت ترین" احساسات است. به طور شهودی می توان حدس زد که Midpoint 0 احساسات "خنثی" را نشان می دهد ، و اینگونه است که در واقع نیز تعریف می شود.

چگونه وادر نمره ارزش یک متن ورودی را محاسبه می کند؟

Vader به یک فرهنگ لغت متکی است که کلمات و سایر ویژگی های واژگانی متداول برای بیان احساسات در میکروبلاگ ها را ترسیم می کند.

این ویژگی ها عبارتند از:

  • لیست کاملی از شکلک های به سبک غربی (به عنوان مثال -: D و: P)
  • مخفف های مربوط به احساسات (به عنوان مثال - LOL و ROFL)
  • عامیانه معمولاً با ارزش احساسات استفاده می شود (به عنوان مثال - نه و مه)

ایجاد یک فرهنگ لغت کامل احساسات یک فرآیند پر کار و گاه مستعد خطا است. بنابراین جای تعجب نیست که بسیاری از محققان پردازش زبان طبیعی (NLP) به عنوان منابع اصلی به فرهنگ لغت های موجود بسیار متکی هستند.

بدون اینکه به جزئیات فنی عمیق بروید ، در اینجا یک فرآیند دو مرحله ای برای ایجاد چنین فرهنگ لغت وجود دارد.

vader sentiment analysis dictionary steps

محققانی که روی Vader کار می کنند ، کاربرد کلی این ویژگی های واژگانی را که مسئول احساسات با استفاده از رویکرد "W Rowd" (WOTC) است ، تأیید کردند.

WOTC به این ایده متکی است که دانش جمعی از گروهی از افراد که از طریق نظرات جمع شده بیان می شوند ، می توانند به عنوان جایگزینی برای دانش تخصصی اعتماد کنند. این امر به آنها کمک کرد تا یک امتیاز معتبر را برای نمره ظرفیت احساساتی هر متن بدون متن بدست آورند.

Amazon Mechanical Turk (MTURK) یکی از چنین بازار معروف جمعیتی است که در آن رأی دهندگان متخصص توزیع شده وظایفی مانند سخنرانی های رتبه بندی را از راه دور انجام می دهند.

نمره ارزش برخی از متن های بدون متن عبارتند از:

  • ارزش مثبت: "خوب" 0. 9 "خوب" 1. 9 است و "عالی" 3. 1 است
  • ارزش منفی: "وحشتناک" -2. 5 ، شکلک "است :(" -2. 2 است و "بمکد" است و مشتق عامیانه "sux" هر د و-1. 5 است

چگونه وادر نمره ارزش یک جمله ورودی را محاسبه می کند؟

Vader از برخی قوانین استفاده می کند تا تأثیر هر متن زیر را بر شدت درک شده احساسات در متن سطح جمله درج کند. این قوانین را اکتشافی می نامند. 5 مورد از آنها وجود دارد.

  • توجه داشته باشید برای خوانندگان پیشرفته: این اکتشافات فراتر از آنچه که معمولاً در یک مدل معمولی از کلمات ضبط می شود. آنها روابط حساس به کلمه را بین اصطلاحات درج می کنند.

پنج اکتشافی وادر:

  1. نگارشی ، یعنی نقطه تعجب (!) ، میزان شدت آن را بدون تغییر جهت گیری معنایی افزایش می دهد. به عنوان مثال: "هوا گرم است."شدیدتر از" هوا گرم است. "
  2. سرمایه گذاری ، به طور خاص با استفاده از همه از کلاه ها برای تأکید بر یک کلمه مرتبط با احساسات در حضور سایر کلمات غیر سرمایه دار ، میزان شدت احساسات را بدون تأثیر در جهت گیری معنایی افزایش می دهد. به عنوان مثال: "هوا گرم است."شدت بیشتری نسبت به "هوا گرم است".
  3. اصلاح کننده های درجه (همچنین به شدت ، کلمات تقویت کننده یا ضرب المثل درجه نیز گفته می شود) با افزایش یا کاهش شدت ، شدت احساسات را تحت تأثیر قرار می دهد. به عنوان مثال: "هوا بسیار گرم است."شدیدتر از "هوا گرم است." ، در حالی که "هوا کمی گرم است."شدت را کاهش می دهد.
  4. تغییر قطبیت به دلیل پیوستگی ها ، پیوستگی متضاد "اما" نشانگر تغییر در قطبیت احساسات است ، با احساسات متن پیروی از پیوند حاکم است. به عنوان مثال: "هوا گرم است ، اما تحمل آن است."احساسات مختلط دارد ، و نیمه دوم رتبه کلی را نشان می دهد.
  5. گرفتن نفی قطبیت ، با بررسی توالی متناقض 3 مورد قبل از ویژگی واژگانی با احساسات ، تقریباً 90 ٪ موارد را می گیریم که نفی قطبیت متن را می چرخاند. به عنوان مثال ، یک جمله نفی "هوا واقعاً گرم نیست".

نمرات Vader مرکب برای تجزیه و تحلیل احساسات

نمره مرکب با جمع بندی نمرات ارزش هر کلمه در واژگان محاسبه می شود ، مطابق قوانین تنظیم می شود و سپس عادی می شود که بی ن-1 (شدیدترین منفی) و 1+ (شدیدترین مثبت) باشد. اگر می خواهید یک اندازه یک بعدی از احساسات برای یک جمله معین باشد ، این متریک مفیدترین است.

همانطور که در مقاله توضیح داده شد ، محققان در زیر عادی سازی استفاده کردند.

که در آن x = جمع نمرات ارزش کلمات تشکیل دهنده ، و α = ثابت عادی سازی (مقدار پیش فرض 15 است)

اجرای پایتون وادر

Vader نیز به زبانهای برنامه نویسی دیگر منتقل شده است. توزیع استاندارد پایتون با ماژول Vader همراه نیست. ما برای انجام این کار از نصب بسته محبوب Python Package ، PIP استفاده خواهیم کرد.

یک بسته شامل تمام پرونده های مورد نیاز برای یک ماژول است. ماژول ها کتابخانه های کد پایتون هستند که می توانید در پروژه خود درج کنید. ما از کد زیر در ترمینال آناکوندا برای نصب Vader استفاده می کنیم.

Vader در خود بسته NLTK گنجانده شده است. ماژول NLTK برای پردازش زبان طبیعی استفاده می شود. NLTK مخفف ابزار ابزار زبان طبیعی است و یکی از سیستم عامل های پیشرو برای کار با داده های زبان انسانی است. در عوض ممکن است استفاده شود.

نسخه ی نمایشی با استفاده از جملات توضیح 5 اکتشافی

پس از انجام محیط زیست ، وقت آن است که دستان خود را کثیف کنید. من از برخی جملات مشابه با مواردی که برای توضیح 5 اکتشاف استفاده می شود استفاده می کنم و خودتان می توانید الگوریتم را ببینید که نمرات مختلفی را پرتاب می کند.

vader sentiment analysis demo score output

چگونه از Vader در تجارت استفاده کنیم؟

از نظر تاریخی ، معامله گران در سراسر جهان هنگام برقراری تماس های تجاری به اخبار مربوط به ابزارهای مربوطه و بازارها به طور کلی تکیه کرده اند.

معاملات دستی در معرض خطر قرار گرفت که ناشی از تعصبات شخصی و پاسخ عاطفی است که معامله گر ممکن است به دلیل هرگونه خبری در اطراف آن باشد. با ظهور معاملات الگوریتمی ، چنین خطرات به حداقل رسید. با تشدید این رقابت ، معامله گران شروع به ارائه تکنیک های جدید کردند تا نسبت به سایر بازرگانان حاشیه ای داشته باشند.

ترکیب تجزیه و تحلیل احساسات در مدل های تجارت الگوریتمی یکی از این روندهای نوظهور است. معامله گران هوشمند شروع به استفاده از نمرات احساسات حاصل از تجزیه و تحلیل عناوین مختلف و مقالات موجود در اینترنت برای اصلاح سیگنال های تجاری خود تولید شده از سایر شاخص های فنی کردند.

بهترین بخش همه چیز است ، از اخبار خراشیده شده گرفته تا گرفتن نمرات احساسات امروزه می توان با چند خط کد به راحتی به راحتی خودکار شد. این به خلاقیت معامله گر بستگی دارد ، چگونه می توان بیشترین استفاده را از تکنیک ها در دسترس قرار داد.

ما یک مدل ساده را با استفاده از میانگین های متحرک ساده به عنوان شاخص اصلی فنی خود ایجاد خواهیم کرد و سپس از نمرات احساسات Vader برای تصحیح تماس های تجاری خود استفاده خواهیم کرد.

خوانندگانی که نمی دانند میانگین های متحرک ساده می توانند از این لینک پیروی کنند. دیگران می توانند به بخش بعدی پرش کنند.

تولید تماس های تجاری با استفاده از Vader و میانگین های متحرک ساده

AMD از زمانی که دکتر لیزا سو (فارغ التحصیل MIT) مقام مدیرعامل را به دست گرفت ، محصولات بسیار خوبی را منتشر کرده است. این شرکت به دلیل مهارت های رهبری قوی خود ، از اینکه به شدت بدهی به داشتن یکی از سهام ترین سهام برای چند سال گذشته در شاخص S& P 500 ایالات متحده بازگردد ، عقب نشینی کرده است.

من فکر کردم جالب است که ببینیم سهام با احساسات خبری خود در این اوقات سخت حرکت می کند که آینده به نظر نمی رسد.

vader sentiment analysis used to generate trade calls

با استفاده از pandas datareader برای خراش داده های سهام

vader sentiment analysis using python and pandas

با استفاده از استراتژی متقاطع متحرک ساده برای تولید تماس های تجاری

vader sentiment analysis using sma vader sentiment analysis output mac

معرفی API Newsapi.org

News API یک API ساده HTTP REST است که پرونده های JSON را با عناوین خبری باز می گرداند و مقالات بیش از 30،000 منبع خبری و وبلاگ را جستجو می کند.

می توان مقالاتی را با هر ترکیبی از معیارهای زیر جستجو کرد:

  • کلمه کلیدی یا عبارت ، به عنوان مثال: تمام مقالات حاوی کلمه "AMD" را پیدا کنید.
  • تاریخ انتشار ، به عنوان مثال: تمام مقالات منتشر شده دیروز را پیدا کنید.
  • نام منبع ، به عنوان مثال: تمام مقالات "TechCrunch" را پیدا کنید.
  • نام دامنه منبع ، به عنوان مثال: تمام مقالات منتشر شده در gizmodo.com را پیدا کنید.
  • زبان ، به عنوان مثال: تمام مقالات نوشته شده به زبان انگلیسی را پیدا کنید.

برای استفاده از API به یک کلید API نیاز دارید - این یک کلید منحصر به فرد است که درخواست های شما را مشخص می کند.

 

بهترین قسمت: آنها برای توسعه ، منبع باز و استفاده غیر تجاری رایگان هستند. شما می توانید یکی را در اینجا دریافت کنید.

 

Api-Key رایگان خود را تولید کنید. آن را برای مصارف آینده ذخیره کنید. برای کشف کامل این API فوق العاده ، مستندات را بررسی کنید.

با استفاده از حالت توسعه دهنده newsapi.org برای استخراج عناوین خبری

گرفتن نمرات Vader مرکب برای عناوین خبری استخراج شده

vader sentiment analysis from news headlines

حفظ نمرات ترکیبی شدید (حداکثر و دقیقه) برای عناوین خبری همان روز

جمع بندی و محاسبه نمرات نهایی Vader

vader sentiment analysis calculating final scores

با استفاده از نمرات Vader ترکیب نهایی با آستانه برای تولید تماس های تجاری

با توجه به رفتار بی ثبات بازارها این روزها ، ما از 0. 20 به عنوان ارزش آستانه برای برقراری تماس های تجاری در مدل خود استفاده خواهیم کرد.

vader sentiment analysis generating trade calls vader sentiment analysis output trade calls

ادغام سیگنال های تجاری با SMA در اولویت بالاتر و Vader برای پالایش

vader sentiment analysis merged trade calls

شما کار بسیار خوبی را برای ساختن آن تا پایان وبلاگ انجام دادید ، بنابراین به پشت خود به عقب بروید.

نتیجه

  • اگرچه ما از SMA به عنوان نشانگر فنی اصلی خود استفاده کردیم ، در حین استفاده از Vader با دیگران نیز با هیچ مشکلی روبرو نخواهد شد.
  • بدیهی است ، ترکیب تجزیه و تحلیل احساسات Vader ما را به مدل SMA خام سوق می دهد و این در مورد قدرت تجزیه و تحلیل احساسات در تجارت الگوریتمی صحبت می کند.
  • توجه داشته باشید که ، در صورت درگیری ، ما SMA را در اولویت قرار دادیم و سیگنال های Vader را فقط برای اهداف پالایش گرفتیم.
  • قبل از استفاده از هر مدل الگوریتمی ، برای پشتی بسیار مهم است ، به محافظت ، تجارت کاغذی اضافه کرده و بهینه سازی کنید.

اکنون که می دانید وادر چگونه کار می کند ، ادامه دهید و با آن آزمایش کنید. خوش بگذره!

شما دیده اید که چگونه احساسات در زمان های اخیر بازارها را هدایت کرده است. شما می توانید از پردازش زبان طبیعی برای تدوین استراتژی های معاملاتی جدید با استفاده از توییتر ، داده های اخبار اخبار در دوره تجارت با استفاده از تجزیه و تحلیل احساسات توییتر استفاده کنید.

اگر می خواهید حرفه خود را در روش های مدرن در امور مالی توسعه دهید ، حتماً این دوره را در مورد تجزیه و تحلیل احساسات برای امور مالی بررسی کنید. این جنبه های مختلف تجارت ، تصمیمات سرمایه گذاری و برنامه را با استفاده از تجزیه و تحلیل خبری ، تجزیه و تحلیل احساسات و داده های جایگزین پوشش می دهد.

مقالات آموزش فارکس...
ما را در سایت مقالات آموزش فارکس دنبال می کنید

برچسب : نویسنده : بهزاد فراهانی بازدید : 86 تاريخ : شنبه 12 فروردين 1402 ساعت: 21:06