КОНТЕНТ-АНАЛИЗ WEB-ДОКУМЕНТОВ СОГЛАСНО ПОИСКОВЫМ ЗАПРОСАМ
Аннотация и ключевые слова
Аннотация (русский):
В работе рассматривается метод обработки информации на естественном языке латентно-семантический анализ, анализирующий взаимосвязь между коллекцией документов и словами в них встречающимися. Анализ пользовательского запроса был произведен в системах Яндекс и Google. Рассмотрены показатели term frequency - показатель частоты или плотности вхождений термина в конкретном документе, а также показатель соотношения количества использования термина и суммарного числа слов в документе и inverse document frequency - обратная частота документа относительно запроса, то есть отношение всей подборки документов в поисковой базе к тем, что содержат в себе заданный термин.

Ключевые слова:
латентно-семантический анализ, латентно-семантический индекс, поисковая оптимизация, поисковый маркетинг, контент-маркетинг
Текст
The paper considers the method of processing information in natural language latent-semantic analysis, which analyzes the relationship between the collection of documents and the words they meet. The analysis of the user request was made in Yandex and Google systems. The term frequency parameters are considered - an indicator of the frequency or density of occurrences of a term in a specific document, as well as an indicator of the ratio between the use of the term and the total number of words in the document and the inverse document frequency - the inverse frequency of the document with respect to the query, that is the ratio of the entire collection of documents in the search database to those, that contain a given term.
Список литературы

1. Chen C.M. et al. Telcordia LSI engine: Implementation and scalability issues // Research Issues in Data Engineering, 2001. Proceedings. Eleventh International Workshop on. IEEE, 2001. С. 51-58.

2. Что такое LSI или латентно-семантический индекс для лучшего понимания контекста страницы https://seoprofy.ua/blog/wiki/what-is-lsi-keywords

3. Латентно-семантическое индексирование cropas.by/seo-slovar/lsi

4. Латентно-семантический анализ https://dic.academic.ru/dic.nsf/ruwiki/595989

5. Bifet Figuerol A. C. et al. An analysis of factors used in search engine ranking. 2005.

6. Ryley J.F., Saffer J., Gibbs A. Advanced document retrieval techniques for patent research // World Patent Information. 2008. Т. 30. № 3. С. 238-243.

7. Проверка TF-IDF https://ru.megaindex.com/support/faq/tf-idf

Войти или Создать
* Забыли пароль?