Notre lexique de l'IA et de l'IDP
L'IA souveraine est une approche de l'intelligence artificielle qui garantit que les données sont hébergées et traitées localement, sans dépendre de technologies étrangères. Par exemple, une IA souveraine en France serait développée et opérée entièrement par des entités françaises, respectant ainsi les réglementations nationales sur la sécurité des données.
L'IA supervisée est un type de machine learning où le modèle est formé à partir de données étiquetées. Les exemples fournis au modèle incluent à la fois des entrées et des sorties attendues, ce qui permet au modèle d'apprendre les relations entre elles. Par exemple, pour identifier des emails de spam, on entraîne un modèle en lui fournissant des milliers d'exemples d'emails étiquetés comme spam ou non-spam.
L'ICR est une extension de l'OCR qui permet de lire l'écriture manuscrite et de la convertir en format numérique. Par exemple, l'ICR est utilisé pour numériser des formulaires remplis à la main, comme des documents administratifs ou des notes manuscrites, automatisant ainsi l'intégration des informations manuscrites dans les systèmes numériques.
Le Traitement Intelligent des Documents est une technologie qui permet d'automatiser la gestion de documents non structurés ou semi-structurés en utilisant des technologies comme l'intelligence artificielle, le Machine Learning, le traitement du langage naturel (NLP), et la reconnaissance optique de caractères (OCR). Par exemple, l'IDP peut extraire les informations d'une facture et les convertir en données exploitables dans un système comptable. L'IDP permet d'extraire des informations utiles, de les organiser en métadonnées et de rendre ces données exploitables pour d'autres systèmes.
L'indexation consiste à utiliser les métadonnées extraites des documents pour les organiser et faciliter leur recherche. Par exemple, l'IDP peut indexer automatiquement un ensemble de contrats par date, auteur ou type, rendant ainsi chaque document plus facile à localiser.
Les Large Language Models sont des modèles d'IA capables de traiter de grandes quantités de texte et d'en extraire des informations pertinentes. Par exemple, GPT-4 peut être utilisé pour résumer un document complexe ou répondre à des questions sur son contenu. Ils permettent une compréhension contextuelle avancée des documents, facilitant ainsi l'extraction des données et l'analyse des contenus complexes.