Des nouvelles de Stephane

Poursuivant mon tour des anciens collegues de DS, j’ai déjeuné avec Stephane Larger, autrefois en charge du développement de l’integration entre CATIA et SMARTEAM. Stephane dirige depuis février une équipe de développement chez SYSTRAN, l’éditeur français de solutions de traduction automatique. L’occasion, pour moi, d’en connaître un peu plus sur ce domaine. SYSTRAN est une société qui a démarré il y une trentaine d’années, et qui se spécialisait dans la traduction de contenus pour des besoins liés à la sécurité nationale (le fameux DoD). Voici un lien vers un des services qui emploient SYSTRAN. Une société frnçaise qiu compte le DoD parmi ses clients, celà est suffisamment rare pour éveiller mon intérêt.
Depuis, la société a évolué, et adresse trois secteurs:
  • les solutions de traduction automatique grand public, type utilisation à domicile ou traduction en ligne
  • les services professionnels pour entreprise, type traduction automatique de sites support
  • enfin le secteur de la défense, qui reste un très gros consommateur de ce type de technologies (mais, deveinez quoi? les langues cibles ont légèrement évoluées en 30 ans…)
L’occasion, également, de découvrir que là aussi, Google investit. Et de quelle manière! L’approche de Google serait complètement statistique, et ferait l’impasse sur l’approche linguistique habituelle (analyse syntaxique et sémantique, etc.). L’idée sous-jacente est que de nombreux documents existent dans plusieurs langues, traductions élaborées par des êtres humains, et donc dont la fiabilité est avérée. Dans ce cas, pourquoi ne pas utilsier l’information statistique sur le fait que tel terme est traduit par tel terme, dans telle phrase, avec tel ou tel pourcentage d’apparition. Un modèle purment probabiliste. Original et élégant, si on a les moyens en terme de serveurs.

Cet article vous a plu ? Pourquoi ne pas le partager ?