Votre recherche
Résultats 34 ressources
-
Nous présentons une expérience menée sur la correction d’orthographe automatique de textes issus de la reconnaissance optique des caractères (OCR), dans l’objectif de mesurer l’impact de la correction sur une tâche d’extraction d’informations. À partir d'un échantillon de documents d’archives numérisées (océrisées), nous avons appliqué un système de reconnaissance d’entités nommées avant et après une correction d’orthographe. Les résultats obtenus ont montré que le correcteur orthographique...
-
Les présentations de notre colloque 2022 peuvent être consultées en ligne.
-
En collaboration avec Teklia, les Archives de la Ville de Belfort ont lancé un projet pilote consistant à réaliser la transcription automatique de l'ensemble des registres de délibérations des conseils municipaux de la commune. Le projet vise à traiter automatiquement 18 500 pages de comptes rendus divers, rédigés entre 1790 et 1946, et poursuit un double objectif. À travers ce projet innovant, Teklia déploie sa technologie d'HTR (Handwritten Text Recognition) et d'OCR (Optical Character Recognition) pour les traitements des documents numérisés.
-
Nombre de projets incluent aujourd’hui une étape d’acquisition automatique du texte dans leur chaîne de production ou d’exploitation des données. Plusieurs plateformes de transcription et différents moteurs HTR sont maintenant disponibles. L’intégration de cette technologie dans des chaînes de traitement de plus en plus efficaces a entraîné une automatisation des tâches qui remet en question la place du chercheur dans le processus d’établissement du texte. Cette nouvelle pratique, gourmande...
-
L’intelligence artificielle s’impose désormais dans tous les domaines des sciences humaines et sociales, lesquelles accueillent cette nouvelle approche à la fois en tant que méthodologie de traitement des données, et en tant qu’objet de recherche à part entière. Signe d’un second tournant numérique de la recherche, cet engouement témoigne de la convergence entre les besoins en traitement massif des données de la recherche et des archives patrimoniales, après les larges campagnes de...
-
Enrichir le patrimoine écrit archivistique grâce aux technologies numériques : Ingénierie du projet LectAuRep (Lecture automatique de répertoires)
-
Surveiller des fonds, préparer des chantiers de collections, trier des reliures nécessitant des restaurations : et si ces tâches fondamentales du travail de conservation et de restauration pouvaient bénéficier des avancées de l’intelligence artificielle ? Et si des réseaux de neurones entraînés sur des matériaux adaptés pouvaient venir en aide aux professionnels des bibliothèques, en détectant des détériorations sans devoir prévoir de fastidieuses opérations préparatoires ? Des spécialistes...
-
DALGOCOL (« Fouille de Données et ALGOrithmes de prédiction de l’état des COLlections ») a été lancé en 2018 par Alaa Zreik dans le cadre de sa thèse de doctorat. L’objectif n’est pas d’aboutir à un outil opérationnel, mais de tester la possibilité d’utiliser des méthodes d’intelligence artificielle sur les données informatiques produites par la Bibliothèque nationale de France (BnF) dans le cadre de ses activités de conservation. Pourquoi recourir à l’IA ? L’un des enjeux est notamment de...
-
La reconnaissance automatique de caractères manuscrits propose désormais des solutions sur-mesure pour traiter un certain nombre de sources archivistiques. Le point sur les projets en cours. Les technologies de pointe, en l’occurrence l’intelligence artificielle, sont en train de révolutionner la recherche archivistique et l’exploitation des sources. Dans un entretien qu’elle nous a accordé en septembre, Françoise Banat-Berger, cheffe du service interministériel des Archives de France au...
-
Données d’archives en français des XIXe et XXe siècles. Transcrire, annoter et éditer numériquement des documents d’archives. Segmentation automatique d'image, Archives Nationales. Reconnaissance automatisée des mots manuscrits.
-
Conception et réalisation d’un outil de détection, de classification et de résolution des entités nommées dans les instruments de recherche archivistiques encodés en XML/EAD.
-
Dépasser le biais du simple critère quantitatif : tel est l’enjeu pour l’évaluation de la recherche aujourd’hui. En effet, l’impact du travail d’un chercheur se mesure encore trop souvent au nombre d’articles dans lesquels ses propres articles ont été cités. Or dans sa tâche d’écriture, un auteur pose un œil critique sur chacun des articles qu’il cite ; il peut ne citer un article que pour le situer chronologiquement par rapport à l’état de l’art, et exprimer un avis neutre à son propos ; il...
-
Accélérer la découverte, améliorer la santé et les soins : les enjeux de l’information biomédicale sont de taille. Pour faire face au nombre accru de publications à indexer, et mettre les références à disposition de ses utilisateurs dans un délai très rapide, la Bibliothèque américaine de médecine (National Library of Medicine - NLM), la plus grande bibliothèque médicale du monde, a lancé en 2018 MEDLINE 2022. Ce projet consiste à passer à l’indexation MeSH automatisée des citations MEDLINE...
-
Les métiers du Droit, loin de l’image parfois traditionnelle qu’on leur prête, sont aux avant-postes de nombreuses innovations technologiques. Le monde du droit investit en effet de plus en plus dans les solutions d’aide à la décision reposant fortement sur l’intelligence artificielle. Ainsi LexisNexis, leader de l’information juridique numérique, avec sa plateforme d’information et d’Analytics juridiques Lexis 360®Intelligence, a placé l’IA au cœur de ses développements : non pas pour...
-
Une étude sur la légitimité et l'autorité de l'information produite numériquement. Les vingt-cinq dernières années ont vu se remodeler les dispositifs infocommunicationnels visant à concevoir des connaissances, à les organiser et à les rendre publiques, en bouleversant les cadres éditoriaux traditionnels jusqu'à faire primer, dans la société de l'information, la raison computationnelle sur la raison humaine. Cette transformation se caractérise par de nouveaux agencements entre documents,...
-
Présente à toutes les étapes du cycle de l’information, l’IA fait évoluer les pratiques documentaires et lance de nouveaux défis pour gérer et valoriser l’information. Dans un environnement en pleine évolution, il s’agit ici de démystifier le sujet de l’IA et d’éclairer les acteurs du champ de l’information professionnelle et scientifique : ce numéro spécial IA offre des repères technologiques et juridiques, présente quelques usages matures et impacts réels de l’IA dans trois domaines clés...
-
Portail de publications francophones en sciences humaines et sociales, Cairn.info propose depuis peu des recommandations personnalisées, générées de façon automatique. Fondées principalement sur l’analyse sémantique des documents grâce aux technologies de traitement automatique du langage, ces recommandations sont déployées avec prudence, afin d’une part de laisser l’utilisateur maître de ses propres recherches, d’autre part de privilégier une compréhension plus large des interactions entre publications scientifiques.
-
Au vu des récentes avancées en termes de performances et accessibilité, la traduction automatique neuronale apparaît comme la solution pour briser les barrières linguistiques freinant la circulation de l’information et des savoirs. Son rôle deviendrait donc déterminant dans un paysage à dominante anglophone comme la communication scientifique, qui pourrait ainsi se projeter vers un multilinguisme systématique. Les études réalisées jusqu’à aujourd’hui montrent cependant une réalité plus...
-
L’intelligence artificielle envahit le monde. Le secteur de l’information et de la documentation ne lui échappe pas d’autant qu’il est en réalité l’un des tout premiers secteurs sur lequel elle a fait ses armes et forgé ses premières victoires. Indexation automatique, moteur de recherche, traduction automatique, reconnaissance d’image, analyse sémantique de contenu, Text Mining, résumé automatique et plus généralement, traitement automatique des langues, étaient les prémisses de cette...
-
Cet article présente les technologies d’IA relevant du Traitement du langage naturel (TAL, ou Traitement automatique du langage naturel (TALN) et leurs usages dans le secteur des médias et de l’édition. Une première partie présente les principales fonctions du TALN puis analyse les circonstances économiques et les usages pour lesquels ces technologies peuvent être mises en œuvre. Une deuxième partie fait un panorama des contextes de mise en œuvre des solutions de TALN et donne quelques exemples pratiques de cas d’usage en conditions opérationnelles.
-
Grâce aux technologies d’IA intégrées dans des enceintes connectées, les personnes âgées malvoyantes pourront très bientôt accéder à une médiathèque de 40 000 livres audio de manière autonome, sans avoir à manipuler un clavier ou un écran. Cette médiathèque, créée au sein du projet européen Lis mon livre, par l’Association Valentin Haüy, l’une des principales associations françaises de personnes handicapées visuelles, a déjà été adoptée par d’autres associations, au Canada et en Norvège.
-
Cet article présente les résultats de la première année de recherche doctorale sur l’utilisation d’une technologie de l’intelligence artificielle, l’apprentissage profond, pour évaluer l’état de conservation des archives reliées du Parlement de Paris à partir de photographies et d’une manière automatique. Ce doctorat est mené à l’université de CY Cergy Paris Université en partenariat avec les Archives nationales et le laboratoire ETIS.
-
Les dernières années, les services d'archives ont entrepris de vastes campagnes de numérisation, dans le but de préserver les fonds documentaires. Ces documents scannés sont alors disponibles sous forme d'images, matrices de pixels. Notre objectif est de reconnaître automatiquement le contenu de ces images pour en extraire de l'information interprétée. C’est ce que l’on appelle l’analyse automatique d’images de documents.
-
Les nouvelles technologies, et plus particulièrement l’intelligence artificielle, offrent de nombreuses perspectives en termes de gain de traitement des archives. Près d’un million de documents bénéficient de la reconnaissance par ordinateur des écritures manuscrites et rejoignent progressivement la salle des inventaires virtuelle.
-
Quand il s’agit d’organiser ou de rendre accessibles des informations complexes, ou d’aider les chercheurs ou analystes à découvrir de nouvelles informations, les vocabulaires structurés (lexiques, dictionnaires, thésaurus, taxonomies…) et plus largement les bases de connaissance, jouent un rôle important. Mais encore faut-il les mettre constamment à jour, ce qui représente une tâche longue, fastidieuse et difficile. Le cas de la veille juridique illustre bien ce problème. Dès lors, une...
-
L’Artificial Intelligence Act est une proposition législative publiée par la Commission européenne le 21 avril 2021. Ce texte est une nouvelle illustration de la « troisième voie » numérique développée par l’Union européenne pour concilier le besoin d’innover avec la nécessité de respecter les droits et les valeurs européennes. La définition juridique de cet équilibre est complexe et la proposition d’Artificial Intelligence Act n’y fait pas exception.
-
Depuis son apparition dans les années 50, l’intelligence artificielle a énormément progressé. La capacité accrue du calcul machine, l’apprentissage automatique, perfectionné avec des algorithmes puissants, et optimisé par des approches combinatoires tirant profit des technologies de la langue, l’ont portée à un stade d’industrialisation avancé, si bien qu’elle est en passe d’opérer une véritable synergie entre l’intelligence créative de l’être humain et les capacités de traitement de...
-
Face à la désinformation, l’intelligence artificielle fait-elle partie du problème ou de la solution ? Ou des deux à la fois ? Le projet européen WeVerify (2018-2021), auquel vient de participer l’AFP, a élaboré plusieurs outils de vérification de l’information utilisés par des milliers de journalistes et fact-checkeurs.Retour sur expérience.
-
Socface est un projet de recherche soutenu par l'Agence nationale pour la Recherche (ANR), porté par l'Institut national d'études démographiques (INED) et la société Teklia, en partenariat avec Paris School of Economics et le Service interministériel des Archives de France (SIAF). Il vise à étudier les changements de la société française sur un siècle grâce à l'exploitation d'une source décrivant précisément la population française : les recensements de la population de 1836 à 1936,...
-
Le projet Socface réunit archivistes, démographes, économistes, historiens et informaticiens travaillant ensemble pour mettre au point des technologies de traitement à grande échelle de vastes séries de documents historiques. Le projet mobilise la reconnaissance automatique d’écriture manuscrite pour analyser l’ensemble des listes nominatives du recensement de 1836 à 1936 (soit 20 recensements). Le projet produira une base de données de tous les individus ayant vécu en France entre 1836 et...
-
« Modoap » et « BaOIA » : deux mots venus d’une langue galactique quelconque ? Pas tout-à-fait (mais presque). Derrière ces sigles énigmatiques se cachent deux projets d’intelligence artificielle auxquels participe La contemporaine. Modoap (Modèles et outils d’apprentissage profond)...
-
Le volume d’informations produits dans les entreprises ne cesse de croître à une vitesse très rapide du fait de la mutation de leur système de production induites par l’utilisation des technologies de l’information et de la communication. Dans les structures publiques et privées, la difficulté d’accéder en temps réel à la documentation administrative est une réalité. Dans ce contexte, deux questions se posent. D’abord comment extraire de ce masse documentaire les informations utiles à...
-
Une nouvelle révolution numérique est actuellement en cours dans le domaine de la documentation, grâce aux technologies de reconnaissance de l’écriture manuscrite, qui facilitent la retranscription automatisée de textes écrits à la main. Avec plusieurs millions de documents manuscrits dans ses réserves, BAnQ s’apprête à expérimenter cette révolution par l’entremise de son implication dans le projet Nouvelle-France numérique. Année après année, depuis plus de 20 ans, BAnQ enrichit son offre...
-
Valérie Lee est responsable de l'atelier Arts graphiques du département des restaurateurs de l'INP. Elle a démarré son doctorat par le projet en 2020, mention « Conservation-restauration du patrimoine » .
Explorer
Discipline archivistique
Profession d’archiviste
Pratique et traitement archivistique
Type et support d’archives
- Documents cartographiques (1)
- Documents iconographiques (2)
- Documents numériques (4)
- Documents textuels (3)
- Support ancien (1)
- Support papier (1)
Propriétés des archives
- Archives ouvertes (1)
- Archives publiques (1)
Outil et unité de traitement
- Instruments de recherche (1)
- Outils de gestion (1)
-
Unités de traitement
(8)
- Collection d'archives (1)
- Connaissances (1)
- Document (1)
- Donnée (6)
- Fonds d'archives (1)
- Mégadonnées (Big Data) (1)
Type d’institution
- Bibliothèque (3)
- Centre d'archives (5)
- Communication (2)
- Culture (1)
- Droit (2)
- Gouvernement (1)
- Littérature (1)
- Médias (2)
- Science (3)
Région géographique
-
Amérique
(2)
- Canada (1)
- États-Unis (1)
-
Europe
(5)
- Europe (Sujet général) (1)
- France (4)
Période
- 19e siècle (1)
- 20e siècle (1)
Discipline et méthode connexes
- Intelligence artificielle
- Bibliothéconomie (1)
- Démographie (1)
- Documentation (1)
- Humanités numériques (1)
- Informatique (8)
- Linguistique (1)
- Philologie (1)
- Sciences de l'information (7)
- Sociologie (1)
Type de ressource
- Article de colloque (5)
- Article de revue (22)
- Billet de blog (4)
- Livre (1)
- Page Web (2)
Année de publication
-
Entre 2000 et 2025
(33)
- Entre 2020 et 2025 (33)
- Inconnue (1)
Ressource en ligne
- Oui (34)