هرگونه سوال یا نظری دارید،می توانید در این قسمت مطرح کنید.
یک ابزار حرفه ای به منظور انجام عملیات متن کاوی است که به طور گسترده در زمینه پردازش زبان طبیعی (NLP) استفاده می گردد. این ابزار توسط دانشگاه پنسیلوانیا امریکا در سال 2001 ارائه گردیده است و حدود 17 سال است که در زمینه آموزش و پژوهش دانشگاه ها استفاد...
کار با پایگاه داده لغوی WordNet یا (A Lexical Database for English)
23 دقیقهآنالیز احساسات اسناد متنی (Sentiment Analysis)
16 دقیقهفراوانی واژه ای اسناد متنی (Term Frequency)
9 دقیقهریشه یابی کلمات به کمک الگوریتم های ریشه یابی (Stemming Algorithms)
12 دقیقهبرچسب گذاری اجزای کلام یک سند متنی (Part-of-speech tagging)
10 دقیقهشناسایی و استخراج Bigrams از یک سند متنی (Bigrams)
14 دقیقهحذف کلمات زائد از اسناد متنی (Remove Stopwords)
15 دقیقهانواع عملیات Tokenization بر روی اسناد متنی
13 دقیقهشمارش واژه های اسناد متنی (word_tokenize)
14 دقیقهنحوه دسترسی به مجموعه اسناد کتابخانه NLTK یا (Corpora Access)
15 دقیقهنصب ابزار NLTK و داده های مربوط به آن (NLTK and Data Install )
21 دقیقهمقدمه و مروری بر دوره (Introduction)
7 دقیقهسلام عزیزان: یکی از چالش های اساسی که امروزه حوزه ای تی و بخصوص شرکت های بزرگی مانند گوگل با آن روبه رو هستند، چالش نحوه آنالیز مجموعه بزرگی از متون موجود در وب می باشد. یکی از روش هایی که با استفاده از آن می توان داده های متنی را مورد کاووش و آنالیز قرار داد، متن کاوی (text mining) می باشد.متن کاوی (پردازش متن) به دنبال استخراج دانش نهفته شده در دل مجموعه داده های متنی نیز می باشد. ابزارهای زیادی برای انجام عملیات متن کاوی وجود دارد مانند RapidMiner، Python Text mining، Voyant و ... در این دوره ما شما را با نحوه انجام انواع عملیات متن کاوی با استفاده از ابزار NLTK آشنا خواهیم کرد. NLTK یک ابزار حرفه ای به منظور انجام عملیات متن کاوی است که به طور گسترده در زمینه پردازش زبان طبیعی (NLP) استفاده می گردد. این ابزار توسط دانشگاه پنسیلوانیا امریکا در سال 2001 ارائه گردیده است و حدود 17 سال است که در زمینه آموزش و پژوهش دانشگاه ها استفاده می شود. NLTK امروزه به طور گسترده در بیش از 30 دانشگاه معتبر امریکا درس داده می شود. یکی از مهمترین مزایای ابزار NLTK داشتن مجموعه داده های متنی بسیار گسترده و کاربردی می باشد که در انواع عملیات متن کاوی می توان از آن ها استفاده کرد. از مهمترین مباحث آموزشی در این دوره: 1. نصب ابزار و داده های آن 2. Tokenization 3. StopWords 4. Stemming 5. POS Tagging 6. Wordnet 7. Synonyms and Antonyms 8. Sentiment Analysis 9. Frequency Distribution 10. Bigrams 11. ... با ما همراه باشید ارادتمند شما: کاظم تقندیکی موفق باشید
هرگونه سوال یا نظری دارید،می توانید در این قسمت مطرح کنید.
برای دسترسی همیشگی به این آموزش و امکان دانلود ، در آن ثبت نام کنید.
در مورد مباحث دوره می توانید با مدرس صحبت کنید.