ОПТИМИЗАЦИЯ СТАНДАРТОВ СБОРА ДАННЫХ О СЕЛЬСКОХОЗЯЙСТВЕННОЙ ДЕЯТЕЛЬНОСТИ В АНАЛИТИЧЕСКИХ ЦЕЛЯХ

P.K. Kutsenogy, candidate of physical and mathematical sciences, T.A. Luzhnykh, V.S. Riksen Siberian Federal Scientific Center for Agrobiotechnology RAS RF, 633501, Novosibirsk Region, Krasnoobsk, ul. Central, Presidium Email: peter@kutsenogiy.ru

  • П. К. Куценогий, кандидат физико-математических наук Сибирский федеральный научный центр агробиотехнологий РАН
  • Т. А. Лужных Сибирский федеральный научный центр агробиотехнологий РАН
  • В. С. Риксен Сибирский федеральный научный центр агробиотехнологий РАН

Аннотация

В статье рассмотрены важность и ценность использования больших данных (Big data) в сфере сельского хозяйства. Технологии «больших данных» предполагают обработку огромного объема разнообразных структурированных и неструктурированных данных, а также использование различных инструментов, подходов, методов их обработки, позволяющие анализировать информацию, необходимую для решения конкретных целей и задач. Извлечение информации из таких массивов данных и дальнейший ее интеллектуальный анализ, открывают возможность сельхозпроизводителям улучшить качество принимаемых решений и определить своевременные, более эффективные методы ведения сельского хозяйства. Представлены разработанные шаблоны баз данных, максимально полно учитывающих особенности собираемой и анализируемой информации в интересах сельхозпроизводителей и отраслевых экспертов. В работе была поставлена задача – создать гибкую структуру, которую можно оперативно дополнить новой значимой информацией. Проведено тестовое наполнение разработанных шаблонов первичной информацией для проверки работоспособности создаваемой структуры базы данных. Часто статистика ведется не с целью получения объективной информации, а с некими «политическими» или рыночными манипуляциями. Дополнительно возникает проблема «прерывности» данных, собираемых в период очередных кампаний, которые через некоторое время сходят на нет. Использование стандартов для обеспечения взаимодействия между системами – ключевое требование эффективной интеграции информации. Учитывая опыт заполнения создаваемой базы данных, а также тестируемых возможностей использования сформулированы требования к стандартам сбора данных сельхозпроизводителей.

Литература

1. Когаловский, М.Р. Метаданные в компьютерных системах / М.Р. Когаловский // Наука «Интерпериодика». – 2013. – Т. 39 – № 4. – С. 28-46.
2. Нафикова, А.Р. Практическое руководство по Microsoft SQL Server / Учебное пособие // А.Р. Нафикова – Стерлитамак: Стерлитамакский филиал БашГУ. – 2014. – 124 с.
3. Чубукова, И.А. Data Mining: учебное пособие /2-е изд., испр. //И.А. Чубукова — М.: Интернет-Университет Информационных Технологий; БИНОМ. Лаборатория знаний. – 2008. — 382 с.
4. Coble, K. Big data in agriculture: a challenge for the future / К. Coble, A. Misra, S. Ferrell, T. Griffin // Applied Economic Perspectives and Politics. – 2018. – Р. 79–96.
5. Hammer, C. Big Data: Potential, Challenges, and Statistical Implications / С. Hammer, D. Kostroch //CUSSION NOTE. – 2017. – Р. 11-15.
6. Hastie, T. Chapter 15. Random Forests / Т. Hastie, R. Tibshirani, J. Friedman // The Elements of Statistical Learning: Data Mining, Inference, and Prediction. — 2nd ed. — Springer-Verlag, 2009. — 746 p.
7. ISO/IEC 2003 Information technology — Reference Model of Data Management // [electronic resource]. 2003. https://www.iso.org/files/live/sites/isoorg/files/develoring_stanards/docs/en/big_data_report-jtc1.pdf
8. Jamack, P. Hive as a tool for ETL or ELT / Р. Jamack // IBM. – 2014. – Р. 4-8.
9. Park, H. Recent advancements in the Internet-of-Things related standards / Н. Park, H. Kim, H. Joo, J. Song // A oneM2M perspective. ICT Express, vol. 2, no. 3. – 2016. – Р. 126-129.
10. Ribarics, P. Big data and its impact on agriculture /Р. Ribarics // Ecocycles 2 (1). – 2016. – Р. 31-35.
11. Tseng, G. Gradient Boosting and XGBoost / G. Tseng // [electronic resource]. 2018. https://medium.com/@gabrieltseng/gradient-boosting-and-xgboost-c306c1bcfaf5
12. Vasileios, T. Frequent patterns in ETL workflows: an empirical approach / Т. Vasileios // Data and knowledge engineering. – 2017. – Р. 1–16.
Опубликован
17-01-2021
Как цитировать
КУЦЕНОГИЙ, П. К.; ЛУЖНЫХ, Т. А.; РИКСЕН, В. С.. ОПТИМИЗАЦИЯ СТАНДАРТОВ СБОРА ДАННЫХ О СЕЛЬСКОХОЗЯЙСТВЕННОЙ ДЕЯТЕЛЬНОСТИ В АНАЛИТИЧЕСКИХ ЦЕЛЯХ. Вестник российской сельскохозяйственной науки, [S.l.], n. 6, p. 10-13, янв. 1970. ISSN 2500-2082. Доступно на: <http://www.vestnik-rsn.ru/vrsn/article/view/738>. Дата доступа: 17 янв. 2021 doi: https://doi.org/10.30850/vrsn/2020/6/10-13.
Раздел
ЭКОНОМИКА И УПРАВЛЕНИЕ