Россия
В работе рассматривается метод обработки информации на естественном языке латентно-семантический анализ, анализирующий взаимосвязь между коллекцией документов и словами в них встречающимися. Анализ пользовательского запроса был произведен в системах Яндекс и Google. Рассмотрены показатели term frequency - показатель частоты или плотности вхождений термина в конкретном документе, а также показатель соотношения количества использования термина и суммарного числа слов в документе и inverse document frequency - обратная частота документа относительно запроса, то есть отношение всей подборки документов в поисковой базе к тем, что содержат в себе заданный термин.
латентно-семантический анализ, латентно-семантический индекс, поисковая оптимизация, поисковый маркетинг, контент-маркетинг
1. Chen C.M. et al. Telcordia LSI engine: Implementation and scalability issues // Research Issues in Data Engineering, 2001. Proceedings. Eleventh International Workshop on. IEEE, 2001. С. 51-58.
2. Что такое LSI или латентно-семантический индекс для лучшего понимания контекста страницы https://seoprofy.ua/blog/wiki/what-is-lsi-keywords
3. Латентно-семантическое индексирование cropas.by/seo-slovar/lsi
4. Латентно-семантический анализ https://dic.academic.ru/dic.nsf/ruwiki/595989
5. Bifet Figuerol A. C. et al. An analysis of factors used in search engine ranking. 2005.
6. Ryley J.F., Saffer J., Gibbs A. Advanced document retrieval techniques for patent research // World Patent Information. 2008. Т. 30. № 3. С. 238-243.
7. Проверка TF-IDF https://ru.megaindex.com/support/faq/tf-idf