Tous les nouveaux outils d’intelligence artificielle générative ont un point commun : leur « intelligence » est fonction des données à partir desquelles ils sont formés. Ces « modèles de langage de grande taille » ont besoin d’immenses quantités d’information pour apprendre, s’adapter et s’améliorer. Afin de suivre l’évolution du monde, ces données doivent être renouvelées en permanence. Et où ces outils vont-ils chercher ces informations actualisées ? De préférence, à partir de sources qualifiées, de contenus de haute qualité, pertinents et à jour. En d’autres termes, ces outils d’IA doivent suivre l’actualité du monde entier, ingurgitant, digérant, en temps réel, des milliers de pages et de sites d’information et de médias en ligne.

Les grandes entreprises technologiques d’IA ont commencé à répondre à la pression de rémunérer les entreprises médiatiques pour le contenu utilisé dans le développement de leurs Modèles de Langage de Grande Taille. Par exemple, OpenAI a conclu un accord avec Axel Springer, Le Monde et l’Associated Press, tandis que Meta a signé un accord similaire avec Reuters. Cependant, ces accords sont largement orientés vers les conglomérats médiatiques anglophones et occidentaux, négligeant ainsi la grande majorité des médias indépendants dans le monde (y compris de nombreux médias influents et taille significative). Ainsi, par exemple, aucun accord public n’a été signé avec des médias fournissant une couverture en portugais, swahili ou hindi, des langues pourtant parlées par plus d’un milliard de personnes. Le fait de mettre ces médias de côté pour se concentrer uniquement sur des médias anglosaxons ou occidentaux biaise nécessairement la lecture et donc les contenus produits par les outils d’IA générative.

Pour la majorité de la population mondiale, il s’agit donc d’une très mauvaise nouvelle. Mais à long terme, cela représente aussi une mauvaise nouvelle pour les grandes entreprises technologiques. Si les outils d’IA qu’elles développent ne sont pas pertinents pour la majorité de la planète, s’appuyant sur des informations qui ne sont ni fiables, ni actualisées, ou simplement incomplètes et biaisées sur des événements qui peuvent se dérouler par exemple au Kerala en Inde ou dans l’État d’Ibo au Nigéria, non seulement l’utilité de ces outils sera limitée, mais elle pourrait être contre-productive. Lorsqu’ils fonctionnent dans des langues pour lesquelles le nombre de sources est limité, les Modèles de Langage de Grande Taille commettent davantage d’erreurs, introduisent des biais de genre et « hallucinent » plus fréquemment, générant des informations fausses ou trompeuses. En résumé, les outils d’IA générative risquent d’aggraver les inégalités d’accès à l’information fiable à l’échelle mondiale et d’amplifier la désinformation.

Pour les rédactions, conclure des accords avec les grands développeurs d’IA pourrait également augmenter leurs revenus. Alors que produire une information indépendante, fiable et de qualité nécessite des coûts importants pour les médias, l’industrie de l’information traverse une crise financière profonde, exacerbée par l’effondrement de sources de revenus autrefois viables. Cette nouvelle ère de l’IA pourrait marquer un tournant et potentiellement entraîner la disparition des médias tels que nous les connaissons, à mesure que les entreprises technologiques ingèrent les informations provenant des organisations de presse sans les rémunérer, notamment en ce qui concerne les sources non anglophones.

De plus en plus, le public et les consommateurs d’information se tournent vers des espaces tels que les chatbots ou les agrégateurs alimentés par l’IA, et qui ne génèrent pas de revenus publicitaires pour les sites de médias dont ils pompent pourtant le contenu. Et la tendance devrait encore s’accélérer dans les années à venir.

À moins que les médias d’intérêt public à travers le monde ne soient rémunérés pour l’utilisation de leurs contenus d’actualités, ces problèmes seront exacerbés tant pour les médias que pour les entreprises technologiques. Mais comment les « petits » médias, qui parfois écrivent ou diffusent dans des langues parlées par quelques millions de personnes à peine, peuvent-ils négocier des accords avec les plus grands géants de la tech ? Et comment, à l’inverse, ces géants de la tech peuvent-ils gérer au cas par cas leur relation avec des milliers d’organes de presse répartis dans près de 200 pays ?

Il est urgent de mettre en place un mécanisme pour y parvenir : identifier et négocier au nom de tous ces organes de presse du monde entier afin d’obtenir un accord équitable avec les grandes entreprises technologiques qui développent des outils d’IA, leur permettant de s’appuyer sur des sources d’information de qualité, véritablement locales et indépendantes, qui rendent compte d’une réalité de terrain. Du monde tel qu’il est vraiment.

Lors du sommet de l’IA cette semaine à Paris, l’organisation que je dirige, le Fonds International pour les Médias d’Intérêt Public (International Fund for Public Interest Media – IFPIM) – soutenue par le gouvernement français ainsi que par 18 autres donateurs – lancera le Global Media Trust, qui aura pour mission de construire et de négocier cet accord. Le Global Media Trust a été développé en collaboration avec Current AI, et créera de la valeur pour les deux parties : les rédactions pourront être rémunérées pour les informations qu’elles produisent, et les grandes entreprises technologiques pourront développer des Modèles de Langage de Grande Taille et des outils d’IA générative plus fiables, objectifs et précis. En fin de compte, ce sont les utilisateurs qui bénéficieront le plus, car ils auront accès à des informations fiables et précises dans leurs propres langues.

Ne pas prendre en compte la diversité l’importance et le nombre de médias indépendants à travers le monde, alors que les entreprises technologiques sont en quête désespérée de sources de données de qualité pour leurs modèles d’IA, constituerait un échec dans la concrétisation du potentiel énorme de l’IA. À mesure que les organisations de presse s’effondrent financièrement à un rythme accéléré, l’IA pourrait se retrouver sans données vérifiées sur lesquelles s’appuyer. Et nuire à notre capacité à disposer d’une information fiable et équilibrée. Le Global Media Trust est un moyen novateur et puissant d’éviter ce scénario, et de garantir que la richesse et la profondeur de l’information produite par les journalistes se retrouvent dans les modèles d’IA à mesure qu’ils évoluent.

Nishant Lalwani, PDG du International Fund for Public Interest Media