![]() |
||
| В данном разделе представлены ссылки на работы русских и зарубежных авторов на тему анализа тональности текста. | ||
|
Статья посвящена моделированию автоматизированного извлечения тональной информации об удовлетворенности клиента из текста отзыва. Целью исследования является разработка модели анализа тональности текста для решения задачи предсказания степени удовлетворенности пользователя медицинским учреждением по тексту отзыва, с применением гибридного подхода на основе лексиконов и машинного обучения. Работа выполнена на материале корпуса отзывов о частных клиниках Челябинска с портала 2GIS объемом 100 тыс. словоупотреблений. |
||
2. Построение корпуса текстов для настройки тонового классификатора (Ю.В. Рубцова) В работе представлен инструмент для сбора и анализа корпуса коротких текстов. Первый модуль инструмента – сбор текста (парсер). Второй модуль отвечает за обработку корпуса и состоит из двух частей: морфологической раз-метки корпуса и составления общетематического словаря эмоциональной лексики (извлечения списков наиболее часто употребляемых слов и словосочетаний с целью выделения значимых слов для положительных и отрицательных текстов); при этом для каждого слова и словосочетания рассчитывается набор статистических характеристик, свойственных для положительной или отрицательной окраски текста. |
||
|
В этом обзоре рассмотриваются такие важные аспекты, как выбор набора данных, алгоритма, языковые аспекты и новые задачи анализа тональности. Рассматривается пригодность существующих наборов данных (например, IMDB Movie Reviews, Twitter Sentiment Dataset) и методов глубокого обучения (например, BERT) для анализа тональности. |
||
|
В работе представлено прогнозное библиометрическое исследование трендовых тем в коллекции «PubMed» в области анализа тональности текстов на основе словарей. Исследование выполнено с использованием коллекции научных статей, индексирующихся в библиографической базе данных «PubMed», из которой были отобраны 147 статей, имеющие в заголовках и аннотациях ключевые слова «sentiment analysis» (анализ тональности) и «dictionary» (словарь). Выявлен значительный рост (в 21 раз за 6 лет) ежегодно публикуемых подобных статей. Рассчитан и представлен рейтинг релевантных ключевых слов в отобранных статьях. Среди релевантных ключевых слов выявлены трендовые ключевые слова c прогнозируемым долгосрочным ростом трендов. Представлена семантическая карта трендовых ключевых слов, содержащая информацию о новизне и долгосрочности трендов. В результате визуального анализа семантической карты выявлены две трендовые темы: (1) вопросы благополучия, (2) удовлетворение пациентов и заказчиков. К вопросам благополучия относятся трендовые подтемы: одиночество, депрессия, устойчивость к подобным проблемам, стратегии их преодоления. |
||
5. Сравнение методов машинного обучения для решения задачи анализа тональности (М.В. Швенк) В статье был собран и размечен корпус текстов отзывов на медицинские услуги. Также были апробированы три способа решения задачи анализа тональности, относящиеся к методам традиционного или глубокого машинного обучения. Проведен сравнительный анализ полученных результатов. Размеченный корпус выложен в открытый доступ и может быть использован для других исследований. |
||
6. Анализ тональности новостей о международной торговле в условиях санкций: подходы NLP (С.А. Осокина) Статья посвящена исследованию особенностей обработки естественного языка (NLP) в новостных сообщениях о торговых санкциях. Основное внимание уделяется выявлению лексических и структурных характеристик текстов, которые могут повлиять на качество автоматизированного анализа. В работе подчеркивается важность учета контекста и культурных различий при оценке тональности новостей, а также обсуждаются сложности, связанные с интерпретацией экономического и политического контента. Представлен обзор современных методов анализа сентимента, включая подходы на основе машинного обучения и нейронных сетей. |
||
7. Анализ тональности пользовательских отзывов с использованием модели Naive Bayes (М.А. Зуев) В данной работе разработана и реализована система анализа тональности пользовательских отзывов на примере текстов о смартфоне с использованием методов машинного обучения. Цель исследования заключается в автоматическом определении эмоциональной окраски отзывов —положительной, нейтральной или отрицательной —на основе текстового содержания и пользовательского рейтинга. Для достижения поставленной цели были последовательно реализованы этапы предобработки текста, его преобразование в числовое представление с помощью метода TF-IDF и последующая классификация с применением наивного байесовского алгоритма. В работе использован набор из 200 отзывов, представленных в формате CSV-файла. В качестве инструментов были задействованы библиотеки языка программирования Python: pandas, re и scikit-learn. Проведённые эксперименты показали, что даже при использовании сравнительно простой модели можно достичь устойчивых результатов классификации. Разработанная система способна обрабатывать как обучающую выборку, так и новые, ранее не встречавшиеся отзывы. Результаты подтверждают эффективность предложенного подхода для прикладных задач анализа пользовательского мнения, мониторинга репутации и предварительной фильтрации контента. Перспективы развития включают расширение модели за счёт внедрения более сложных алгоритмов и дополнительных этапов обработки текста. |
||
| Проект "Анализ тональности" | © Иркутский государственный университет © Почекунина М. В. | |