top of page

Cohérence culturelle des données: le Pacifique donne de la voix - 15/09/2039

Depuis plus d’une trentaine, l’avènement de l’intelligence artificielle, et notamment du deep learning, s’est fait grâce à l’exploitation d’un nombre immense de données obtenues, plus ou moins légalement, via les grandes plateformes de l’internet.

La problématique récurrente de ces données, à l’image de la recherche en science sociale, a été le fait que la majeure partie d’entre elles ont été collectées sur des échantillons relativement réduits de la population mondiale.

De fait, cela a donné lieu à de nombreuses situations discriminantes, pour dire le moins, où les outils des technologies de l’information ont clairement forcé nombre d’individus de part le monde, non issus du cadre culturel de ces bases de données, à rentrer dans le cadre.


Le fait est qu’avec l’explosion des services et outils relevant d’intelligence artificielles issues du deep learning, les situations biaisées ou limitantes pour de nombreuses communautés sont devenues de vraies sources de préjudices pour énormément de monde : inaccessibilité aux bourses universitaires, difficultés quant à l’immigration ou aux contrôles de sécurité, manque total de visibilité et donc persistence de préjugés sociaux sur ces communautés.


Après une longue période de passivité, les ONG culturelles et les ministères de l’éducation du Pacifique se sont rencontrés récemment en séminaire pour étudier la situation, tâcher de mesurer les impacts réels de ce manque de représentativité des bases de données IA et faire des propositions à l’échelle des instances internationales.

L’objectif de ce séminaire est de donner la voix du Pacifique face aux nombreux instituts de recherche, entreprises et gouvernements des Etats en pointe dans le développement de l’IA, pour tâcher de les convaincre d’adopter une méthodologie plus inclusive et d’intégrer, dans leurs programmes de recherche et de développement, les instituts du Pacifique.


Si la recherche en matière d’IA est toujours relativement peu développée dans le Pacifique, ce n’est pas le cas des recherches en matière de linguistique et de “language processing” qui sont très souvent utilisés dans la gestion et l’exploitation des bases de données par l’intelligence artificielle.


Or, en l’état, compte tenu de l’importante diversité linguistique du Pacifique, nombres d’universitaires considèrent actuellement qu’exploiter la diversité présente dans le Pacifique permettrait à la recherche en IA de faire d’importants progrès dans l’apprentissage en matière linguistique et de reconnaissance vocale.


Quels sont les espoirs de ce séminaire? Très faible pour être honnête, le Pacifique faisant peu le poids face aux géants technologiques. Mais, clairement, il n’y a aucun risque à tenter le coup et, en coulisses, beaucoup des participants, bien que réalistes (pour ne pas dire cyniques), ont malgré tout espéré que cela crée un mouvement global qui pourrait, à terme, peser de façon plus importante sur les “grands”.

8 vues0 commentaire
bottom of page