مقدمه ای بر دسته بندی متون

دانشگاه صنعتی امیر کبیر
حامد زارعی - پوریا برقی مقدم
1395-1394

بخش ١ : مقدمه
بخش ۲ : دسته بندی متون
بخش ٣ : دسته بندی با Naive Bayes
بخش ۴ : Sentiment Analysis
خلاصه

بخش ١
مقدمه

استخراج اطلاعات

ترجمه با ماشین

چرا فهم زبان طبیعی سخت است؟

خب حالا چجوری این داده ها را استخراج کنیم؟!؟

Regular Expression

دیگر به چی نیاز داریم؟

ساختن درختی دو دویی...

خب چجوری دو تا رشته رو با هم مقایسه کنیم!؟




INTENTION

EXECUTION

Minimum Edit Distance

از جمله کارهایی که برای بهبود این روش انجام می شود: Backtrace و Weighted MED

N-gram

بخش ٢
دسته بندی متون

آیا این ایمیل spam است ؟


نویسنده این نوشته ها خانم است یا آقا ؟


نظرات مثبت و منفی درباره محصولات ، فیلم ، موسیقی ؟


مثال های دیگر از کاربرد دسته بندی متون


تعریف text classification

روش های دسته بندی

روش های دسته بندی

بخش ٣
دسته بندی با Naive Bayes

Bag of words


Bag of words


قانون بیز


دسته بندی مقالات رویترز

جمع بندی کلی

مقایسه

بخش ۴
Sentiment Analysis

دو دسته کلی:

خلاصه


بخش ١ : مقدمه

بخش ۲ : دسته بندی متون

بخش ٣ : دسته بندی با Naive Bayes

بخش ۴ : Sentiment Analysis

از توجه شما سپاس گزاریم