Assessment of the quality of genealogical data in breeding enterprises of Western Siberia

Cover Page

Cite item

Full Text

Abstract

Analysis of genealogical databases containing more than 6 million records revealed a significant number of gaps in the data on the origin of animals, especially for sires. This complicates the implementation of automated parental pair selection technologies and reduces the effectiveness of inbreeding level control. It was found that on average 7% of records on ancestors up to the third row of the pedigree contain gaps, of which 85.5% are for sires. This is a serious problem in the creation of regional digital platforms for the automation of decision-making in breeding livestock, limits the possibilities of an objective assessment of the breeding value of animals and hinders the necessary pressure of targeted artificial selection and assignment of sires to breeding stock.

Methods for improving the quality of primary genealogical data are proposed, including using foreign sources. It is shown that automation of the decision-making process in purebred dairy breeding allows not only to speed up the detection of errors, but also to significantly reduce the time for their correction thanks to the created data aggregators. This process can become the basis for large-scale verification and validation of primary zootechnical accounting data with subsequent transfer to the Federal State Information and Analytical System of Breeding Resources (FGIAS PR). In addition, this will increase the efficiency of zootechnicians-breeders in large breeding and commercial farms, and will also allow selecting breeding bulls that are genetically compatible with the breeding stock of both a separate region and their totality.

Full Text

Введение.

Молочное скотоводство – одна из важнейших отраслей сельского хозяйства, обеспечивающая население ценными продуктами питания. Повышение эффективности этой отрасли – приоритетная задача аграрного сектора, в решении которой ключевая роль принадлежит селекционно-племенной работе, направленной на улучшение продуктивных и племенных качеств животных (Маринченко Т.Е., 2019; Шевелёва О.М. и Свяженина М.А., 2023). Современное отечественное животноводство претерпевает ускоренную цифровую трансформацию, открывающую новые возможности для интенсификации селекционно-племенной работы. Одним из перспективных направлений такой трансформации является создание информационно-аналитических систем ИАС для генетической оценки и управления селекционным процессом (Cañas-Álvarez JJ et al., 2023; Cole JB et al., 2020). Инструменты цифровых платформ для племенной работы позволяют хранить, обрабатывать и анализировать большие массивы данных, вести электронный учет родословных, оценивать племенную ценность, проводить подбор родительских пар, формировать оптимальную структуру стада, управлять селекционным процессом, а также контролировать и прогнозировать его эффективность (Nilforooshan MA and Saavedra-Jiménez LA, 2020).

За рубежом активно развивается использование геномной селекции с применением искусственного интеллекта и машинного обучения для прогнозирования продуктивности животных (Schaeffer L, 2006; Wiggans GR et al., 2011; Wiggans GR and Carrillo JA, 2022). Широко используются платформы типа CDN (cdn.ca/home) Select Star SA (selectstar.ch) или Interbull (interbull.org). В России разрабатывается Федеральная государственная информационно-аналитическая система племенных ресурсов (ФГИАС ПР), которая должна стать основой для цифровизации племенной работы. Примеры использования ИИ в российском племенном деле пока немногочисленны и находятся на стадии разработки и внедрения (Васильев Н.П. и др., 2024).

Эффективность подобных систем напрямую зависит от качества входных данных, включая генеалогическую информацию (Martin Р et al., 2019; Fioretti М et al., 2020; Toghiani S and Van Raden PM, 2021). Ее неполнота или некорректность неизменно приводит к искажению результатов оценки генетического потенциала (Aguilar I et al., 2020).

На протяжении нескольких десятилетий в России практикуется массовое использование импортного племенного материала, что привело к изменению генеалогической структуры отечественного маточного поголовья чёрно-пёстрого скота, преимущественно за счёт поглотительного скрещивания. Изолированность и локализация баз данных на предприятиях не дают общего представления о реальной генеалогической структуре и сдерживают реализацию крупномасштабной селекции, затрудняя оценку и контроль уровня инбридинга в популяциях разного размера (Cavani L et al., 2018; Nyman S et al., 2022; Silva MHMA et al., 2019). Выявленные проблемы с качеством генеалогических данных подчеркивают необходимость дальнейшей разработки и совершенствования цифровых платформ для объективной и эффективной оценки генетического потенциала животных и управления селекционным процессом.

 

Цель исследования.

Оценка качества генеалогических данных племенных предприятий Новосибирской и Кемеровской областей для последующей разработки цифровых платформ, обеспечивающих объективный прогноз генетического потенциала.

 

Материалы и методы исследования.

Объект исследования. В качестве источников генеалогической информации были использованы базы данных ряда племенных предприятий Новосибирской и Кемеровской областей по разведению молочного скота голштинской породы, открытые данные, публикуемые ФГБНУ ВНИИ- плем (https://vniiplem.ru/l/gisc/bd_ng/db_ng_mol_krs/) и Canadian Dairy Network (CDN) (https://www.cdn.ca/files_ge_datafiles.php) с общим объёмом данных, превышающим 6 млн записей.

Схема эксперимента. Для сопоставления рядов родословных отдельно взятых групп с пропущенными записями о происхождении по всем исследуемым базам данных региона было произведено ранжирование сумм частот, где минимальный ранг соответствует минимальной частоте. Также было проведено ранжирование животноводческих предприятий по степени заполненности генеалогической базы данных с применением интегрального показателя количества пропущенных записей о происхождении животных (без учёта группы «быки-осеменители»). Построены генеалогические деревья линий и семейств, представленных в хозяйствах.

Статистическая обработка. Для обработки данных, проведения анализа и построения генеалогических деревьев использовалось программное обеспечение R (Giorgi FM et al., 2022) с подключением специализированных пакетов (dplyr) (Wickham H and Grolemund GR, 2017).

Для оценки сходства хозяйств по качеству генеалогической информации и выявления групп хозяйств со схожими показателями пропущенных записей был проведён кластерный анализ с использованием расстояния Чебышева (Chen TY, 2019) и метода дальнего соседа (Поддубный B.B. и др., 2006). Для данных с рангами абсолютных частот была выбрана евклидова дистанция (Suwanda R et al., 2020) и метод Уорда (Gaikadi S and Kumar SV, 2024) которые показали наилучшие результаты. Для проведения кластерного анализа и визуализации дендрограмм было использованы пакеты factoextra (Irnawati I et al., 2021) и cluster (Bivand R, 2022). В качестве входных данных для кластерного анализа были использованы две матрицы: матрица с процентом пропущенных записей в генеалогии для каждой группы животных (быки, коровы, тёлки) в 18 хозяйствах и матрица с рангами абсолютных частот пропущенных записей о происхождении в группах животных до третьего ряда родословной. Данный метод позволяет визуализировать процесс объединения хозяйств в кластеры на дендрограмме, что делает его более наглядным и интерпретируемым.

 

Результаты исследований.

Анализ заполненности родословных пробандов племенных предприятий Новосибирской и Кемеровской областей выявил существенную вариабельность качества генеалогической информации в зависимости от источника. Оценка доли пропущенных записей о происхождении животных до третьего ряда родословной показала, что в среднем по региону этот показатель составляет около 7 % (табл. 1). Однако распределение пропущенных данных неоднородно: наибольшее число пропусков наблюдается в третьем ряду родословной по материнской линии (МММ), в то время как записи о происхождении по отцовской линии (О) являются наиболее полными.

Такая закономерность может быть объяснена тем, что зоотехники-селекционеры на предприятиях традиционно уделяют большее внимание заполнению отцовских рядов предков (табл. 1). В условиях широкого использования искусственного осеменения информация о быках-производителях, как правило, более доступна и полностью отражается в сопроводительной документации.

Важно отметить, что высокая доля пропущенных записей, особенно в отношении быков-производителей (85,5 % от общего числа пропусков), представляет собой серьёзную проблему для создания полноценной региональной ИАС. Неполные родословные затрудняют адекватную оценку племенной ценности животных и ограничивают возможности для проведения эффективного подбора родительских пар, направленного на повышение генетического потенциала поголовья.

Дендрограмма, построенная на основе рангов частот пропущенных генеалогических записей до третьего ряда родословной и представленная на рисунке 1, выявила два основных кластера, разделяющих анализируемые группы животных, что указывает на существенные различия в структуре пропусков между ними.

 

Рисунок 1. Дендрограмма групп животных по рангам пропущенных генеалогических записей

Figure 1. Dendrogram of animal groups by ranks of missing genealogical records

 

Первый кластер объединяет всю популяцию, быков-осеменителей и быков, свидетельствуя о высокой степени сходства в структуре рангов пропущенных записей в этих группах (дистанция=2). Это означает, что распределение пропусков по разным предкам для быков и быков-осеменителей практически идентично распределению соответствующих пропусков для всей совокупности животных. Такой результат объясняется тем, что быки и быки-осеменители составляют значительную часть популяции, происхождение которых играет ключевую роль в процессе подбора родительских пар. Второй кластер включает коров и тёлок, что указывает на отличия в структуре рангов пропущенных генеалогических записей для этих групп по сравнению с быками и всей популяцией. Данное различие может быть обусловлено особенностями ведения генеалогического учёта для разных половозрастных групп животных. Информация о происхождении коров и тёлок заполняется менее тщательно относительно таковой о происхождении быков. Необходимо отметить значительное расстояние между двумя кластерами на дендрограмме (дистанция=5.5), которое подтверждает существенные различия в структуре пропущенных генеалогических записей. Проведённый анализ был основан на рангах, а не на абсолютных частотах, что позволило снизить влияние выбросов и различий в общем числе пропусков для разных групп животных, фокусируясь на сравнительном анализе структуры пропусков.

Дендрограмма, построенная на основе рангов частот пропущенных генеалогических записей до третьего ряда родословной (рис. 2), выявила пять кластеров, отражающих структуру пропусков информации о происхождении животных. Кластеры формируются группами предков с похожими паттернами отсутствующих данных, что позволяет выявить тенденции в заполнении генеалогической информации.

 

Рисунок 2. Кластеризация комбинаций предков до третьего ряда родословной по рангам частот пропусков

Figure 2. Clustering of ancestral combinations up to the third row of the pedigree by omission frequency rank

 

Кластер 1 объединяет предков ОМО и MMO (предки третьего ряда родословной с одним материнским и двумя отцовскими предками в каждом случае). Близость этих групп на дендрограмме предполагает наличие схожих причин пропусков информации о происхождении для этих комбинаций предков. Сходство паттернов может быть обусловлено сложностями получения информации о более дальних родственниках, особенно по материнской линии, что объясняет объединение в кластере предков третьего ряда. Кластер 2 включает предков OOM, MOM, OMM и MMM (предки третьего ряда родословной с двумя материнскими и одним отцовским предками, либо с одним материнским и двумя отцовскими, включающие информацию до третьего ряда включительно). В кластер 3 входят предки O и M (предки первого ряда – отец и мать), что указывает на сходную частоту пропусков для непосредственных родителей. Это может быть связано с тем, что информация об отце и матери зачастую записывается одновременно, и если данные об одном из родителей отсутствуют, то с большой вероятностью будут отсутствовать и данные о втором. В кластер 4 входят предки OM и MM (предки второго ряда), близость данного кластера к кластеру 3 связанна с тенденцией к более полному заполнению данных о родителях, чем о более дальних предках. Кластер 5 включает ООО, МОО, ОО и МО (предки второго и третьего ряда). Присутствие в одном кластере предков разных рядов может говорить о том, что на практике заполнение генеалогической информации до второго или третьего ряда родословной обусловлен, скорее всего, практической необходимостью (наличие или отсутствие племенной документации), чем последовательной работой по её заполнению, что объясняет близость предков как второго, так и третьего рядов. Проведённый анализ, основанный на рангах частот пропущенных записей, позволяет сфокусироваться на структуре пропусков и выявить общие тенденции, независимо от абсолютного количества отсутствующих данных в разных группах животных. Дополнительное исследование конкретных рангов внутри кластеров может дать более детальную информацию о причинах возникновения пропусков.

Результаты ранжирования хозяйств по степени заполненности баз данных (табл. 2) подтверждают наличие значительной вариабельности между предприятиями в отношении качества генеалогической информации. Наиболее высокие ранги и, соответственно, наилучшее качество данных демонстрируют хозяйства 16, 18 и 14, в которых ведётся целенаправленная работа по корректировке и актуализации генеалогической информации.

 

Таблица 2. Ранжирование предприятий по качеству генеалогической информации

Table 2. Ranking of enterprises by quality of genealogical information

Хозяйство/ Farm

Пропуски / Omissions

всего рядов предков/ Total rows of ancestors

абсолютное количество/ Absolute number

проценты / Percents

итого (без быков) / Total (without bulls)

ранг/ Rank

быки

/Bulls

коровы

/Cows

тёлки/ Heifers

быки

/Bulls

коровы

/Cows

тёлки/ Heifers

абсолют/ Absolute number

проценты / Percents

1

84938

5211

561

488

6,14

0,66

0,57

1049

3,46

11

2

123340

3997

666

232

3,25

0,54

0,19

898

1,32

9

3

97146

3997

666

2524

4,13

0,69

2,60

3190

1,80

12

4

178024

3539

530

55

1,99

0,30

0,03

585

1,66

4

5

102718

3650

148

12

3,55

0,14

0,01

160

0,79

6

6

212156

12224

839

922

5,76

0,40

0,43

1761

2,22

10

7

130760

3097

800

922

2,37

0,61

0,71

1722

1,66

7

8

116088

2572

848

317

2,22

0,73

0,27

1165

0,50

6

9

411208

29283

8151

1037

7,12

1,98

0,25

9188

1,11

13

10

450198

46037

3287

965

10,23

0,73

0,21

4252

0,47

14

11

773346

85016

8375

116

10,99

1,08

0,01

8491

0,55

16

12

642180

86987

5699

7431

13,55

0,89

1,16

13130

1,03

17

13

210952

35757

0

154

16,95

0,00

0,07

154

0,04

18

14

1545866

5699

0

5014

0,37

0,00

0,32

5014

0,16

3

15

105588

9043

366

3050

8,56

0,35

2,89

3416

1,62

15

16

540876

0

0

0

0,00

0,00

0,00

0

0,00

1

17

120190

0

2721

119

0,00

2,26

0,10

2840

1,18

5

18

173124

0

0

6

0,00

0,00

0,00

6

0,00

2

T

6018698

336109

32991

23364

5,58

0,55

0,39

56355

0,94

 

T – Итого / Total

 

Дендрограмма, построенная с использованием метрики Чебышева и метода полной связи, иллюстрирует структуру сходства/различия 18 племенных хозяйств по проценту пропущенных генеалогических записей для быков, коров и телок (рис. 3).

 

Рисунок 3. Дендрограмма сходства/различия хозяйств по качеству генеалогической информа-ции (1-18, условные обозначения племенных хозяйств)

Figure 3. Dendrogram of similarity/difference of farms according to quality of genealogical information (1-18, designations of breeding farms)

 

Разбивка на 5 кластеров, выделенных на дендрограмме, позволяет детально проанализировать различия между хозяйствами по качеству генеалогической информации. Кластер 1 обособлен на самом высоком уровне иерархии и представлен исключительно хозяйством 13, характеризующимся экстремально высоким процентом пропусков генеалогических записей по быкам (почти 17 %), что значительно превышает показатели всех остальных хозяйств. Кластер 2 объединяет хозяйства 12, 10 и 11, отличающиеся высоким процентом пропущенных записей по быкам (более 10 % в хозяйствах 11 и 12). Дополнительно, в хозяйстве 12 отмечается повышенный процент пропусков по телкам (более 1 %), в то время как хозяйство 10 демонстрирует средние значения пропусков по коровам и тёлкам, не превышающие 1 %. Кластер 3 включает хозяйства 15, 9, 1 и 6, демонстрирующие более высокий, чем в среднем по выборке, процент пропущенных записей. Хозяйства 9 и 15 характеризуются повышенным процентом пропусков по коровам (около 2 % для хозяйства 9) и тёлкам (около 3 % для хозяйства 15) соответственно. В то же время хозяйства 1 и 6 имеют средние значения процента пропусков, находящиеся в интервале 3-6 % для быков и не более 0.7 % для коров и тёлок. Кластер 4 объединяет хозяйства 17, 14, 16 и 18, демонстрирующие высокое качество генеалогической информации. Хозяйства 16, 14 и 18 характеризуются минимальным количеством пропусков по всем группам животных, близким к нулю. Хозяйство 17, имея аналогичный показатель по быкам (около 0 %), демонстрирует наибольший процент пропусков по коровам внутри данного кластера (более 2 %). Кластер 5 включает хозяйства 3, 2, 5, 7, 4 и 8, демонстрирующие низкий процент пропущенных записей по всем трем группам животных, что указывает на достаточно высокое качество генеалогических данных (рис. 3). Процент пропущенных записей по быкам в этих хозяйствах, как правило, не превышает 5 %, за исключением хозяйства 3, для которого характерен несколько более высокий процент пропусков по телкам. В целом, проведённый кластерный анализ позволяет выявить группы хозяйств со сходными характеристиками в отношении качества генеалогической информации и может служить основой для разработки рекомендаций по улучшению ведения генеалогического учета.

            

Обсуждение полученных результатов.

Проведённое исследование позволило оценить качество генеалогических и количественных данных племенных предприятий Новосибирской и Кемеровской областей для разработки региональной (ИАС) генетической оценки и селекции молочного скота. Анализ выявил существенную вариабельность качества генеалогической информации между хозяйствами. В среднем по региону доля отсутствующих записей о происхождении животных до третьего ряда родословной составляет около 7 %. Однако распределение пропущенных данных неоднородно: больше всего пропусков наблюдается в третьем ряду родословной по материнской линии, тогда как записи о происхождении по отцовской линии наиболее полные. Это может объясняться тем, что зоотехники-селекционеры традиционно уделяют больше внимания заполнению отцовских рядов предков, особенно при широком использовании искусственного осеменения (Castro-Vásquez R et al., 2023; Nader N et al., 2021; Cole JB et al., 2021). Высокая доля пропущенных записей, особенно по быкам-производителям (85,5 % от общего числа пропусков), представляет серьёзную проблему для создания качественных баз данных регионального и федерального масштабов, поскольку неполные родословные затрудняют оценку племенной ценности и ограничивают возможности эффективного подбора родительских пар.

Оценка качества количественных данных (удой и содержание жира за 305 дней лактации) показала, что распределение этих признаков во многих хозяйствах статистически значимо отличается от гауссовского. Наиболее частые отклонения связаны с асимметрией и двухвершинностью распределений (Камалдинов Е.В. и др., 2022). Причины такого отклонения могут быть различны: генетическая гетерогенность стада, различия в условиях кормления и содержания животных, особенности селекционной работы. Несоответствие распределения количественных признаков нормальному закону может снижать точность оценки племенной ценности, особенно при использовании смешанных линейных моделей.

Для улучшения качества генеалогических данных и повышения эффективности разработки и использования региональной ИАС рекомендуется восстанавливать и актуализировать генеалогическую информацию на племенных предприятиях, уделяя особое внимание заполнению данных о происхождении быков-производителей. Целесообразно также подключить дополнительные источники генеалогической информации, включая зарубежные базы данных, и внедрить инструменты ИАС для автоматизации поиска и исправления ошибок. Важным аспектом является разработка и внедрение системы мотивации племенных предприятий для поддержания высокого качества генеалогической информации (Brito LF et al., 2020; Georges M et al., 2019; Mrode R et al., 2019).

Для корректной оценки племенной ценности и эффективного подбора родительских пар при негауссовском распределении количественных признаков следует рассмотреть применение специальных статистических методов или трансформацию данных для приближения их к нормальному распределению. Перспективным направлением также является разработка и внедрение категориальных систем оценки племенной ценности, учитывающих различия в уровне продуктивности и условиях содержания животных на разных предприятиях.

В настоящее время активно развиваются методы ИИ для контроля качества данных, включая методы обнаружения выбросов (Aggarwal CC, 2015) и методы предсказания пропущенных значений (Little RJA, 1988). Эти методы могут быть перспективными для автоматизации процесса оценки качества генеалогических данных в животноводстве и повышения достоверности информации в ИАС. Однако практическое применение ИИ для этих целей в племенной работе пока ограничено и требует дальнейших исследований. В перспективе разработка и внедрение инструментов на основе ИИ, таких как системы автоматического обнаружения ошибок и аномалий в данных, могут существенно повысить эффективность контроля качества генеалогических баз данных и обеспечить более высокую достоверность информации, используемой в селекционно-племенной работе.

Реализация этих рекомендаций будет способствовать повышению эффективности разработки и использования региональной ИАС, ускорению генетического прогресса в популяции молочного скота и повышению экономической эффективности молочного скотоводства в регионе.

 

Заключение.

Исследование, посвящённое оценке качества генеалогических данных молочного скота в племенных предприятиях Западной Сибири, выявило ряд важных закономерностей и проблем. Анализ генеалогических баз данных показал высокую вариабельность качества данных между хозяйствами. В среднем по региону доля отсутствующих записей о происхождении животных до третьего ряда родословной составляет около 7 %, однако в некоторых хозяйствах этот показатель значительно выше. Это может свидетельствовать о недостаточном внимании к ведению генеалогического учёта и необходимости разработки унифицированных стандартов племенной документации. Особую проблему представляет высокая доля пропусков по быкам-производителям (85,5 % от общего числа пропусков). Это затрудняет контроль уровня инбридинга и может привести к его нежелательному повышению, негативно влияющему на продуктивность, воспроизводительные качества и здоровье животных.

Неполнота генеалогической информации серьёзно препятствует созданию полноценной региональной ИАС и может привести к недостоверной оценке племенной ценности и неэффективному подбору родительских пар, замедляя генетический прогресс. Поэтому результаты исследования подчеркивают необходимость разработки и внедрения инструментов для автоматизации поиска и корректировки генеалогических данных, а также системы контроля качества вводимой информации. Создание региональной ИАС, основанной на достоверных и полных генеалогических данных, позволит повысить эффективность селекционно-племенной работы в молочном скотоводстве Западной Сибири и ускорить генетический прогресс в отрасли. В перспективе необходимо продолжить исследования, направленные на совершенствование методов оценки и контроля качества генеалогической информации, а также на разработку методик учёта неоднородности стад при оценке племенной ценности животных.

×

About the authors

Evgeny V. Kamaldinov

Novosibirsk State Agrarian University

Author for correspondence.
Email: ekamaldinov@yandex.ru
ORCID iD: 0000-0002-0341-5055

Dr Sci. (Biology), Associate Professor

Russian Federation, Novosibirsk

Alexey F. Petrov

Novosibirsk State Agrarian University

Email: lexluterking@yandex.ru
ORCID iD: 0000-0002-7402-4107

Head of the Laboratory of Applied Bioinformatics

Russian Federation, Novosibirsk

Kirill N. Narozhnykh

Novosibirsk State Agrarian University

Email: narozhnykh@nsau.edu.ru
ORCID iD: 0000-0002-1519-697X

Cand. Sci. (Biology), Associate Professor

Russian Federation, Novosibirsk

Pavel N. Palchikov

JSC Novosibirskagroplem

Email: v.2899936@yandex.ru

Director

Russian Federation, Yarkovo settlement, Novosibirsk region

References

  1. Kamaldinov EV, Petrov AF, Shatohin KS, Narozhnyh KN, Marenkov VG, Zhigulin TA, Bogdanova OV, Palchikov PN, Plakhova AA. Reliability of primary zootechnical records in dairy farming. Bulletin of NSAU (Novosibirsk State Agrarian University). 2022;2(63):76-83. doi: 10.31677/2072-6724-2022-63-2-76-83
  2. Marinchenko TE. Improving of the of dairy breedings efficiency. Journal of VNIIMZH. 2019; 2(34):193-203.
  3. Poddubny VV, Shevelyov OG, Bormashov DA. Comparision of texts clusterization methods quality on the base of hypergeometrical criterion. Tomsk State University Journal. 2006;293:120-125.
  4. Vasilev NP, Protopopova LD, Dayanova GI, Krylova AN, Nikitina NN. Formation of a unified digital platform for the region’s agriculture. International agricultural Journal. 2024;1(397):53-56. doi: 10.55186/25876740_2024_67_1_53
  5. Sheveleva OM, Svyazhenina MA. The influence of bulls on the productive qualities of progeny. Animal Husbandry and Fodder Production. 2023;106(4):40-56. doi: 10.33284/2658-3135-106-4-40
  6. Aggarwal CC. Outlier analysis: advanced concepts. In: Data Mining. Springer, Cham; 2015:265-83. doi: 10.1007/978-3-319-14142-8_9
  7. Aguilar I, Fernandez EN, Blasco A, Ravagnolo O, Legarra A. Effects of ignoring inbreeding in model-based accuracy for BLUP and SSGBLUP. J Anim Breed Genet. 2020;137(4):356-364. doi: 10.1111/jbg.12470
  8. Bivand R. R packages for analyzing spatial data: a comparative case study with areal data. Geographical Analysis. 2022;54(3):488-518. doi: 10.1111/gean.12319
  9. Brito LF, Oliveira HR, McConn BR, Schinckel AP, Arrazola A, Marchant-Forde JN, et al. Large-scale phenotyping of livestock welfare in commercial production systems: a new frontier in animal breeding. Front Genet. 2020;11:793. doi: 10.3389/fgene.2020.00793
  10. Cañas–Álvarez JJ, Ossa-Saraz GA, Garcés-Blanquiceth JL, Burgos–Paz WO. Genealogical structure of the Colombian Romosinuano Creole cattle. Trop Anim Health Prod. 2023;55(5):292. doi: 10.1007/s11250-023-03694-1
  11. Castro-Vásquez R, Vásquez-Loaiza M, Cruz-Méndez A, Domínguez-Viveros J, Camacho-Sandoval J, Saborío-Montero A. Genealogical information analysis of Gyr and Nelore cattle from Costa Rica. Cienc Rural. 2023;53(10):e20220236. doi: 10.1590/0103-8478cr20220236
  12. Cavani L, Silva RM de O, Carreño LOD, Ono RK, Bertipaglia TS, Farah MM, et al. Genetic diversity of Brazilian Brahman cattle by pedigree analysis. Pesq Agropec Bras. 2018;53(1):74-79. doi: 10.1590/s0100-204x2018000100008
  13. CDN. Canadian Networck for Dairy Excelence. [Internet] Available from: https://www.cdn.ca/home.php (accessed 2024 November 27).
  14. Chen TY. New Chebyshev distance measures for Pythagorean fuzzy sets with applications to multiple criteria decision analysis using an extended ELECTRE approach. Expert Systems with Applications. 2019;147(2):113164. doi: 10.1016/j.eswa.2019.113164
  15. Cole JB, Dürr JW, Nicolazzi EL. Invited review: The future of selection decisions and breeding programs: What are we breeding for, and who decides? Journal of Dairy Science. 2021;104(5):5111-24. doi: 10.3168/jds.2020-19777
  16. Cole JB, Eaglen SAE, Maltecca C, Mulder HA, Pryce JE. The future of phenomics in dairy cattle breeding. Animal Frontiers. 2020;10(2):37-44. doi: 10.1093/af/vfaa007
  17. Fioretti M, Negrini R, Biffani S, Quaglia A, Valentini A, Nardone A. Demographic structure and population dynamics of Maremmana cattle local breed after 35 years of traditional selection. Livestock Science. 2020;232:103903. doi: 10.1016/j.livsci.2019.103903
  18. Gaikadi S, Kumar SV. Is ward-level calculation of urban green space availability important?—A case study on Vellore city, India, using the histogram-based spectral discrimination approach. Front Sustain Cities. 2024;6:1393156. doi: 10.3389/frsc.2024.1393156
  19. Georges M, Charlier C, Hayes B. Harnessing genomic information for livestock improvement. Nat Rev Genet. 2019;20(3):135-156. doi: 10.1038/s41576-018-0082-2
  20. Giorgi FM, Ceraolo C, Mercatelli D. The R language: an engine for bioinformatics and data science. Life (Basel). 2022;12(5):648. doi: 10.3390/life12050648
  21. Interbull.International Bull Evaluation Service Official Website. [Internet] Available from: https://interbull.org/index (accessed 2024 November 27).
  22. Irnawati I, Riswanto FDO, Riyanto S, Martono S, et al. The use of software packages of R factoextra and FactoMineR and their application in principal component analysis for authentication of oils. Indonesian Journal of Chemometrics and Pharmaceutical Analysis. 2021;1(1):1-10. doi: 10.22146/ijcpa.482
  23. Little RJA. A test of missing completely at random for multivariate data with missing values. Journal of the American Statistical Association. 1988;83(404):1198-202.
  24. Martin P, Baes C, Houlahan K, Richardson CM, Jamrozik J, Miglior F. Genetic correlations among selected traits in Canadian Holsteins. Can J Anim Sci. 2019; 99(4):693-704. doi: 10.1139/CJAS-2018-0190
  25. Mrode R, Ojango JMK, Okeyo AM, Mwacharo JM. Genomic selection and use of molecular tools in breeding programs for indigenous and crossbred cattle in developing countries: current status and future prospects. Front Genet. 2019;9:694. doi: 10.3389/fgene.2018.00694
  26. Nader N, El-Gamal FEZ, El-Sappagh S, Kwak KS, Elmogy M. Kinship verification and recognition based on handcrafted and deep learning feature-based techniques. PeerJ Computer Science. 2021;7:e735. doi: 10.7717/peerj-cs.735
  27. Nilforooshan MA, Saavedra-Jiménez LA. ggroups: an R package for pedigree and genetic groups data. Hereditas. 2020;157(1):17. doi: 10.1186/s41065-020-00124-2
  28. Nyman S, Johansson AM, Palucci V, Schönherz AA, Guldbrandtsen B, Hinrichs D, et al. Inbreeding and pedigree analysis of the European red dairy cattle. Genet Sel Evol. 2022;54(1):70. doi: 10.1186/s12711-022-00761-3
  29. Schaeffer L. Strategy for applying genome-wide selection in dairy cattle. Journal of Animal Breeding and Genetics. 2006;123(4):218-23. doi: 10.1111/j.1439-0388.2006.00595.x
  30. Select Star SA. [Internet] Available from: https://www.selectstar.ch/de/index.htm. (accessed: 2024 November 27).
  31. Silva MHMA da, Malhado CHM, Kern EL, Daltro D dos S, Cobuci JA, Carneiro PLS. Inbreeding depression in Holstein cattle in Brazil. R Bras Zootec. 2019;48:e20170212. doi: 10.1590/rbz4820170212
  32. Suwanda R, Syahputra Z, Zamzami EM. Analysis of euclidean distance and manhattan distance in the k-means algorithm for variations number of Centroid K. Journal of Physics: Conference Series. 2020;1566(1):012058. doi: 10.1088/1742-6596/1566/1/012058
  33. Toghiani S, VanRaden PM. National Index Correlations and Actual vs. Expected Use of Foreign Sires. Interbull Bulletin. Leeuwarden, The Netherlands, 2021, April 26-30. 2021;56:52-9.
  34. Wickham H, Grolemund G. R for Data Science. Gravenstein Highway North, Sebastopol, CA: O’Reilly; 2017: 520 p.
  35. Wiggans GR, Carrillo JA. Genomic selection in United States dairy cattle. Front Genet. 2022;9(13):994466.
  36. Wiggans GR, Vanraden PM, Cooper TA. The genomic evaluation system in the United States: past, present, future. J Dairy Sci. 2011;94(6):3202-11. doi: 10.3168/jds.2010-3866

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Figure 1. Dendrogram of animal groups by ranks of missing genealogical records

Download (92KB)
3. Figure 2. Clustering of ancestral combinations up to the third row of the pedigree by omission frequency rank

Download (113KB)
4. Figure 3. Dendrogram of similarity/difference of farms according to quality of genealogical infor-mation (1-18, designations of breeding farms)

Download (113KB)

Copyright (c) 2024 Камалдинов Е.V., Петров А.F., Нарожных К.N., Пальчиков П.N.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».