Type de document : article scientifique publié dans Computers and Electronics in Agriculture
Auteurs : Xuqiang Yin, Dihua Wu, Yuying Shang, Bo Jiang, Huaibo Song
Résumé en français (traduction) : La reconnaissance précise et rapide des comportements de mouvement de la vache laitière est la clé d’une perception intelligente de son état de santé. Pour parvenir à la reconnaissance des comportements des vaches en matière de couchage, de station debout, de marche, d’abreuvement et d’alimentation, on a d’abord procédé à l’extraction spatiale d’images vidéo des vaches en se basant sur l’avantage de l’extraction efficace des caractéristiques d’EfficientNet. Ensuite, pour extraire complètement les caractéristiques des différentes informations de comportement des vaches laitières, le BiFPN (réseau bidirectionnel de pyramides de caractéristiques) a été utilisé pour réaliser la fusion efficace des caractéristiques dans les 3 à 5 couches d’EfficientNet. Enfin, les informations de comportement ont été envoyées au module BiLSTM (mémoire bidirectionnelle à long terme et à court terme), qui intègre le mécanisme d’attention pour réaliser l’agrégation des images vidéo dans une série temporelle, réalisant ainsi une reconnaissance rapide et précise des comportements de mouvement des vaches laitières. 1009 vidéos contenant 2 270 250 images de vaches laitières dans différentes scènes et postures ont été collectées et testées pour comparer les performances de l’algorithme proposé, quatre algorithmes de reconnaissance du comportement à la pointe de la technologie : C3D, VGG16-LSTM, ResNet50-LSTM, et DensNet169-LSTM ont été réalisés. Entre-temps, la précision, la mémoire, l’exactitude et le nombre moyen d’images reconnues par seconde (ANFR) ont été utilisés pour évaluer la performance de l’algorithme. Les résultats expérimentaux ont montré que la précision de reconnaissance du comportement de l’algorithme était de 97,87%, soit 4,25% de plus que celle du ResNet50-LSTM classique, et que l’ANFR était de 134f/s. En outre, l’étude a été combinée avec une fenêtre glissante pour réaliser la reconnaissance comportementale de vidéos de vaches laitières non divisées et à cible unique, et la précision de reconnaissance finale a pu atteindre 95,20 %, ce qui montre que l’algorithme proposé est efficace et peut être utilisé pour la perception de l’état de santé et la prévention des maladies des vaches laitières.
Résumé en anglais (original) : Accurate and rapid recognition of dairy cow’s motion behaviours is the key to intelligent perception of its health state. To achieve the recognition of cows’ lying, standing, walking, drinking and feeding behaviours, first, based on the advantage of the efficient feature extraction of EfficientNet, the spatial feature extraction of cow’s video frames was realized. Then, to fully extract the characteristics of different behaviour information of dairy cows, the BiFPN (bidirectional feature pyramid network) was used to realize the efficient fusion of characteristics in the 3–5 layers of EfficientNet. Finally, the behaviour information was sent to the BiLSTM (bidirectional long short-term memory) module, which integrates the attention mechanism to realize the aggregation of video frames in a time series, thus realizing fast and accurate recognition of dairy cow’s motion behaviours. 1009 videos containing 2,270,250 frames of dairy cows in different scenes and postures were collected and tested to compare the performance of the proposed algorithm, four state-of-the-art behaviour recognition algorithms: C3D, VGG16-LSTM, ResNet50-LSTM, and DensNet169-LSTM were carried out. Meanwhile, the precision, recall, accuracy, recall and the average number of frames recognized per second (ANFR) were used to evaluate the performance of the algorithm. Experimental results showed that the behaviour recognition accuracy of the algorithm was 97.87%, which was 4.25% higher than that of the classical ResNet50-LSTM, and the ANFR was 134f/s. In addition, the study was combined with a sliding window to realize the behaviour recognition of undivided single-target dairy cow videos, and the final recognition accuracy could reach 95.20%, showing that the proposed algorithm was effective and could be used for the health status perception and disease prevention of dairy cows.