ЦИФРОВЫЕ ТЕХНОЛОГИИ НА СЛУЖБЕ БИОЛОГИЧЕСКОЙ НАУКИ

Авторы

  • Н. Н. Мельник ФГБУ «ЦСП» Минздрава России
  • Н. Г. Комаров Центральная научная сельскохозяйственная библиотека
  • О. М. Тамбовцева Центральная научная сельскохозяйственная библиотека

DOI:

https://doi.org/10.30850/vrsn/2018/3/6-9

Ключевые слова:

биология, сигнальный путь, препарат, Pathway Studio, , технологии интеллектуального разбора текстов, машинное чтение, big data, совместные встречаемости

Аннотация

За 2013-2014 годы было создано более 90% мировых научных данных, и темпы ускоряются. У исследователей есть три основных варианта для получения сведений из растущего количества литературы: самостоятельное чтение статей (или рефератов), разбор литературы и написание рефератов кураторами, использование специализированного автоматизированного инструмента интеллектуального анализа текстовых документов. В журналах, которые традиционно мало цитируются, появляется 42% высокоцитируемых статей. В рефератах не присутствует 20% ключевых слов. Из полного текста статьи меньше половины ключевых фактов приводится в реферате. Авторы исключают из реферата некоторую техническую или вторичную информацию и почти в 50% случаев информацию, которая менее благоприятна идеи публикации. В 57% случаев важная информация упоминается только в самой статье и отсутствует в реферате. Даже лучшие кураторы не совсем точны. В одном исследовании с использованием рефератов статей PubMed, написанных вручную, с терминами в соответствии с «Генной онтологией», только 39% терминов, определенных тремя разными экспертами были одинаковыми. В другом исследовании, средняя точность аннотирования тремя экспертами медицинских событий в клинических фактах была в пределах 88%. В период с 2003 по 2012 год более чем одна треть совместных встречаемостей появилась в теле статьи до опубликования в рефератах. Текущая версия технологии интеллектуального текстового разбора от Elsevier достигает 98% точности для обнаружения объекта и 88% точности для извлечения связей. Один из наиболее популярных инструментов по интеллектуальному разбору документов и представлению результатов ? Pathway Studio от Elsevier. Количество статей исследователей, упоминающих Pathway Studio, ежегодно растет с 2003 года, достигнув 170 статей в 2014 году. Количество цитирований статей на основе рефератов тоже увеличивается с 2004 года, достигнув 153 цитирования в 2014 году. Также ежегодно с 2006 года растет количество патентов, достигнув 20 патентов в 2014 году. Сочетание контента из журналов высшего качества от Elsevier и технологии автоматизированной интеллектуальной текстовой обработки, которая может обрабатывать и извлекать информацию из буквально миллионов полнотекстовых научных статей и десятков миллионов рефератов в течение нескольких часов, создаёт уникальный инструмент для работы исследователя.

Загрузки

Опубликован

2021-07-12

Выпуск

Раздел

ПОИСК. РЕШЕНИЯ. ОПЫТ

Как цитировать

Мельник, Н. Н., Комаров, Н. Г., & Тамбовцева, О. М. (2021). ЦИФРОВЫЕ ТЕХНОЛОГИИ НА СЛУЖБЕ БИОЛОГИЧЕСКОЙ НАУКИ. Вестник российской сельскохозяйственной науки, 3, 6-9. https://doi.org/10.30850/vrsn/2018/3/6-9