РАЗРАБОТКА МОДИФИЦИРОВАННОГО МЕТОДА WINNOWING ДЛЯ АГРЕГИРОВАНИЯ ДАННЫХ БИБЛИОГРАФИЧЕСКОЙ ИНФОРМАЦИИ ИЗ СИСТЕМ ЦИТИРОВАНИЯ В УСЛОВИЯХ НЕПОЛНОЙ ИНФОРМАЦИИ

Авторы

  • Ирина Павловна Болодурина Автор
  • Юлия Петровна Иванова (Луговскова) Автор
  • Лариса Михайловна Анциферова Автор
  • Владислав Дмитриевич Блинов Автор

Аннотация

В настоящее время переход к представлению библиографической информации о научных работах к электронному виду послужил причиной повышенного интереса к наукометрическим исследованиям. При этом существующие наукометрические методы подвергаются критике со стороны ученых, так как неполная библиографическая база и инструменты ее оценивания не позволяют наиболее точно оценить вклад научного труда. Проблема качества наукометрических оценок, как правило, основывается на исследовании данных некоторой системы цитирования, которая не включает полные сведения обо всех публикациях авторов, содержащихся в других системах цитирования. Цель исследования. Данное исследование направлено на разработку адаптивного подхода для формирования агрегированных данных библиографической информации научной организации в условиях неполной информации из систем цитирования РИНЦ, «Академия Google» и Scopus. Методы. Определение агрегированного списка публикаций для анализа наукометрических показателей проведено методом Winnowing, алгоритмом Левенштейна, методом шинглов и Джаро – Винклера. В рамках экспериментального исследования проведена оценка эффективности применения рассмотренных методов для агрегирования информации систем цитировния на основе анализа точности, полноты и F-меры. Результаты. Эксперименты на тестовых данных списка публикаций авторов Оренбургского государственного университета из систем цитирования РИНЦ, «Академия Google» и Scopus показали, что наиболее точные списки публикаций по критерию F-меры сформировал метод Winnowing. Для повышения производительности данного алгоритма проведена двухэтапная оптимизация процесса агрегирования, которая позволила улучшить время работы алгоритма при формировании списка библиографических описаний. Заключение. Предложенный подход для формирования агрегированных данных библиографической информации научной организации в условиях неполной информации из систем цитирования РИНЦ, «Академия Google» и Scopus позволяет повысить производительность при формировании списка публикаций авторов и показывает хорошую эффективность при определении наукометрических характеристик авторов.

Биографии авторов

  • Ирина Павловна Болодурина
    Болодурина Ирина Павловна, д-р техн. наук, профессор, заведующий кафедрой прикладной математики, Оренбургский государственный университет, г. Оренбург; prmat@mail.osu.ru
  • Юлия Петровна Иванова (Луговскова)
    Иванова (Луговскова) Юлия Петровна, канд. физ.-мат. наук, доцент кафедры прикладной математики, Оренбургский государственный университет, г. Оренбург; ulia_lugovskova@inbox.ru
  • Лариса Михайловна Анциферова
    Анциферова Лариса Михайловна, канд. пед. наук, доцент кафедры прикладной математики, Оренбургский государственный университет, г. Оренбург; antsiferova_68@mail.ru
  • Владислав Дмитриевич Блинов
    Блинов Владислав Дмитриевич, студент, Оренбургский государственный университет, г. Оренбург; blnvvldslv@gmail.com

Опубликован

2020-11-30

Выпуск

Раздел

Краткие сообщения