Apports du machine learning en toxicologie : un exemple d’application

Toxicologie Analytique et Clinique(2023)

引用 0|浏览2
暂无评分
摘要
L’intelligence artificielle, dont l’apprentissage automatique ou « machine learning », a un impact grandissant dans tous les domaines. À partir d’une base de données et d’un certain nombre de variables, il permet de créer des modèles utiles pour prédire un événement, effectuer une classification et peut ainsi constituer une aide précieuse pour répondre à certaines problématiques. La noyade est définie à partir de données contextuelles, d’observations effectuées lors de l’autopsie et de l’étude de biomarqueurs (diatomés, strontium…). Cependant, dans les cas de noyade en eau douce, les conclusions peuvent s’avérer plus difficiles. Des modèles de machine learning supervisé ont été évalués pour apprécier leur pertinence dans l’aide à la classification des noyades. Une base de données sur les noyades est en cours de constitution. Elle comprend des données anthropométriques, des concentrations de strontium (Sr) et de rubidium (Rb) dans la moelle osseuse, le degré de putréfaction (entre 0 [absence] et 4 [putréfaction importante], évalué par deux médecins légistes) et le délai d’immersion supposé. Notre étude s’est focalisée sur 43 cas de découverte en région angevine de cadavre en eau douce. Les concentrations mesurées dans les prélèvements d’eau douce (quand elles ont été collectées) sont comparables à celles observées lors d’une précédente étude dans laquelle les concentrations en strontium mesurées dans les eaux douces de la région s’étendaient de 79,6 à 212,6 μg/L (Huby, congrès SFTA, 2010). Après une étude statistique et une analyse en composante principale, différents modèles de machine learning (python, Jupyter®) ont été testés : logistic regression, SGD classifier, KNearest Neighbors, AdaBoost, Decision Tree et Random Forest. La cible est la classification dans les groupes : vraie noyade (32 cas), fausse noyade (11 cas), contrôle négatif vivant (27 cas), contrôle négatif décédé (17 cas) (décès dû à une cause différente de la noyade). L’attribution au groupe fausse ou vraie noyade a été réalisée par les médecins légistes sur la base des données d’anamnèse, des observations autopsiques, des données anatomopathologiques et des résultats de la recherche des diatomés. Le dataset a été découpé de la façon suivante : 80 % pour l’entraînement et 20 % pour le test. Une validation croisée a été effectuée. Des optimisations (sélection de données, modifications d’hyperparamètres) ont été réalisées et les modèles évalués en termes d’exactitude, sensibilité, spécificité et F1 score. Ce dernier est un bon compromis entre sensibilité et spécificité. La putréfaction a une influence sur la concentration de strontium dans la moelle osseuse suggérant une interprétation des concentrations plus difficile pour des degrés de putréfaction supérieurs à 3. L’ACP a montré que le ratio Sr/Rb (ou concentration de Sr dans la moelle osseuse) est la variable la plus discriminante pour l’affectation à un groupe (cos2, qui représente la qualité de la représentation des variables sur les graphiques de l’ACP, proche de 1). Les modèles présentant les meilleures performances en termes d’exactitude (75 %) et F1 score sont l’AdaBoost et le Random Forest. L’effectif du groupe « fausse noyade » étant moins nombreux, les résultats de classification obtenus par les modèles de machine learning sont les moins bons. Cette première évaluation a permis d’identifier les modèles donnant les meilleures performances pour la question et la cohorte testée. Un effectif plus important et une répartition plus équilibrée des groupes sont nécessaires pour améliorer les modèles dans l’aide à la classification des noyades.
更多
查看译文
关键词
toxicologie,machine learning,dapplication,en
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要