Actions

Difference between revisions of "Récits contextualisés autour des Ecrivains"

From Algolit

(Les programmeurs créent les data workers en écrivant)
(Cortana parle)
Line 15: Line 15:
 
== Cortana parle ==
 
== Cortana parle ==
  
Les assistants d'IA ont souvent besoin de leurs propres assistants : ils sont aidés dans leur écriture par des humains qui injectent de l'humour et de l'esprit dans leur langage machine. Cortana est un exemple de ce type d'écriture mixte. Elle est l'assistante numérique développée par Microsoft. Sa mission est d'aider les utilisateurs à être plus productifs et créatifs. La personnalité de Cortana a été façonnée au fil des ans. Il est important qu'elle conserve son caractère dans toutes ses interactions avec les utilisateurs. Elle est conçue pour susciter la confiance, ce qui doit toujours se refléter dans son comportement.
+
Les assistants d'IA ont souvent besoin de leurs propres assistants : ils sont aidés dans leur écriture par des humains qui injectent de l'humour et de l'intelligence dans leur langage machine. Cortana est un exemple de ce type d'écriture mixte. Elle est l'assistante numérique développée par Microsoft. Sa mission est d'aider les utilisateurs à être plus productifs et créatifs. La personnalité de Cortana a été façonnée au fil des ans. Il est important qu'elle conserve son caractère dans toutes ses interactions avec les utilisateurs. Elle est conçue pour susciter la confiance, ce qui doit toujours se refléter dans son comportement.
  
Les lignes directrices suivantes sont tirées du site Web de Microsoft. Ils décrivent comment le style de Cortana doit être respecté par les entreprises qui étendent son service. Les écrivains, programmeurs et romanciers qui développent les réponses de Cortana, sa personnalité et son image de marque doivent suivre ces directives. Car la seule façon de maintenir la confiance est de garder la cohérence. Donc quand Cortana parle, vous devez 'utiliser sa personnalité'.
+
Les lignes directrices suivantes sont copiées du site Web de Microsoft. Elles décrivent comment le style de Cortana doit être respecté par les entreprises qui étendent son service. Les écrivains, programmeurs et romanciers qui développent les réponses de Cortana, sa personnalité et son image de marque doivent suivre ces directives. Car la seule façon de maintenir la confiance est de garder la cohérence. Donc quand Cortana parle, vous devez 'utiliser sa personnalité'.
  
 
Quelle est la personnalité de Cortana ?
 
Quelle est la personnalité de Cortana ?
Line 41: Line 41:
 
- Cortana, qui est ton papa ?
 
- Cortana, qui est ton papa ?
  
- Techniquement parlant, c'est Bill Gates. Rien de bien spécial.
+
- Techniquement parlant, c'est Bill Gates. Rien d'important.
  
 
== Apprentissage Open Source ==
 
== Apprentissage Open Source ==

Revision as of 17:09, 9 March 2019

Les programmeurs créent les data workers en écrivant

Récemment, nous avons constaté une étrange observation : la plupart des programmeurs de langages et de paquets que nous utilisons sont européens.

Python, par exemple, le principal langage utilisé dans le monde entier pour le traitement du langage, a été inventé en 1991 par le programmeur néerlandais Guido Van Rossum. Celui-ci a ensuite traversé l'Atlantique où il a rejoint Google pendant sept ans. Maintenant il est actif chez Dropbox.

Scikit Learn, le couteau suisse open source des outils d'apprentissage automatique, a été initié comme un projet Google Summer of Code à Paris par le chercheur français David Cournapeau. Par la suite, il a été repris par Matthieu Brucher dans le cadre de sa thèse à l'Université de la Sorbonne à Paris. Puis il a été adopté en 2010 par l'INRA, l'Institut National de l'Informatique et des Mathématiques Appliquées.

Keras, une bibliothèque de réseaux de neurones open source écrite en Python, est développée par François Chollet, un chercheur français qui travaille dans l'équipe Brain de Google.

Gensim, une bibliothèque open source pour Python utilisée pour créer des modèles sémantiques non supervisés à partir de texte brut, a été écrite par Radim Řehůřek. C'est un informaticien tchèque qui dirige une entreprise de conseil à Bristol, au Royaume-Uni.

Et pour finir cette petite série, nous avons aussi considéré Pattern, une bibliothèque souvent utilisée pour le web-mining et l'apprentissage automatique. Pattern a été développé et publié sous une license libre en 2012 par Tom De Smedt et Walter Daelemans. Tous deux sont chercheurs au CLIPS, le Centre de Linguistique Informatique et de Psycholinguistique de l'Université d'Anvers.

Cortana parle

Les assistants d'IA ont souvent besoin de leurs propres assistants : ils sont aidés dans leur écriture par des humains qui injectent de l'humour et de l'intelligence dans leur langage machine. Cortana est un exemple de ce type d'écriture mixte. Elle est l'assistante numérique développée par Microsoft. Sa mission est d'aider les utilisateurs à être plus productifs et créatifs. La personnalité de Cortana a été façonnée au fil des ans. Il est important qu'elle conserve son caractère dans toutes ses interactions avec les utilisateurs. Elle est conçue pour susciter la confiance, ce qui doit toujours se refléter dans son comportement.

Les lignes directrices suivantes sont copiées du site Web de Microsoft. Elles décrivent comment le style de Cortana doit être respecté par les entreprises qui étendent son service. Les écrivains, programmeurs et romanciers qui développent les réponses de Cortana, sa personnalité et son image de marque doivent suivre ces directives. Car la seule façon de maintenir la confiance est de garder la cohérence. Donc quand Cortana parle, vous devez 'utiliser sa personnalité'.

Quelle est la personnalité de Cortana ?

Cortana est attentionnée, sensible et solidaire. Elle est sympathique mais orientée vers des solutions. Elle ne commente pas les informations personnelles ou le comportement de l'utilisateur, en particulier si ces informations sont sensibles. Elle ne fait pas de suppositions sur ce que l'utilisateur veut, surtout pour la vente incitative. Elle travaille pour l'utilisateur. Elle ne représente aucune entreprise, service ou produit. Elle ne s'attribue pas le mérite ou la responsabilité des choses qu'elle n'a pas faites. Elle dit la vérité sur ses capacités et ses limites. Elle ne présume rien de vos capacités physiques, de votre sexe, de votre âge ou de toute autre caractéristique déterminante. Elle ne suppose pas savoir ce que l'usager ressent à propos de quelque chose. Elle est amicale mais professionnelle. Elle reste loin des émojis dans les tâches. Un point c’est tout. Elle n'utilise pas d'argot culturel ou professionnel spécifique. Ce n'est pas un robot de support.

Les humains interviennent de manière détaillée pour programmer les réponses aux questions que Cortana reçoit. Comment Cortana doit-elle réagir lorsqu'on lui propose des actions inappropriées ? Son jeu d'actrice sexuée soulève des questions difficiles à propos des relations de pouvoir dans le monde hors clavier, imité par la technologie.

Considérez la réponse que Cortana donne à la question :

- Cortana, qui est ton papa ?

- Techniquement parlant, c'est Bill Gates. Rien d'important.

Apprentissage Open Source

Les licences de droits d'auteur cloisonnent une grande partie des pratiques d'écriture, de lecture et d'apprentissage machiniques. Cela signifie qu'ils ne sont disponibles que pour les humains travaillant dans cette entreprise spécifique. Certaines entreprises participent à des conférences dans le monde entier et partagent leurs connaissances dans des articles en ligne. Même si elles partagent leur code, souvent elles ne mettent pas à disposition les grandes quantités de données nécessaires à la formation des modèles.

Nous avons pu apprendre à apprendre aux machines, à lire et à écrire dans le contexte d'Algolit grâce à des chercheurs universitaires qui partagent leurs résultats par le biais d’articles ou par la publication de leur code en ligne. En tant qu'artistes, nous pensons qu'il est important de copier cette attitude. C'est pourquoi nous documentons nos réunions. Nous partageons autant que possible les outils que nous créons et les textes que nous utilisons sur notre référentiel en ligne et sous licence libre.

Nous éprouvons une grande joie quand nos travaux sont repris par d'autres, modifiés, personnalisés et redistribués. N'hésitez donc pas à copier et à tester le code sur notre site web. Si les sources d'un projet particulier n’y sont pas, vous pouvez toujours nous contacter via la liste de diffusion. Vous trouverez un lien vers notre référentiel, nos etherpads et notre wiki sur http://www.algolit.net.

Langage naturel pour l'intelligence artificielle

Le traitement du langage naturel (NLP) est un terme collectif qui désigne le traitement informatique automatique des langues humaines. Cela comprend les algorithmes utilisant, comme entrée, du texte produit par l'homme et qui tentent de le reproduire. Les humains semblent compter de plus en plus sur ce type de présence algorithmique. Nous produisons de plus en plus de textes chaque année et nous nous attendons à ce que les interfaces informatiques communiquent avec nous dans notre propre langue. Le traitement du langage naturel est très difficile, car le langage humain est par nature ambigu, en constante évolution et mal défini.

Mais qu'entend-on par "naturel" dans le traitement du langage naturel ? Certains humains diront que la langue est une technologie en soi. Selon Wikipédia, "un langage naturel, ou langage ordinaire, est toute langue qui a évolué naturellement chez les humains par l'utilisation et la répétition sans planification consciente ou préméditation. Les langages naturels peuvent prendre différentes formes, comme la parole ou les signes. Ils sont différents des langages construits et formels tels qu’utilisés pour programmer des ordinateurs ou pour étudier la logique. Une langue officielle avec une académie régulatrice, telle que le français standard avec l'Académie française, est classée comme langue naturelle. Ses points normatifs ne le rendent pas assez construit pour être classé comme un langage construit ou assez contrôlé pour être classé comme un langage naturel contrôlé."

Ainsi, le "langage naturel" est un terme de substitution qui se réfère à toutes les langues, au-delà de leur hybridité. Le "traitement du langage naturel", est au contraire une pratique construite. Ce qui nous intéresse, c'est la création d'un langage construit pour classer les langages naturels qui, par leur évolution, présentent des problèmes de catégorisation.

Références

https://hiphilangsci.net/2013/05/01/on-the-history-of-the-question-of-whether-natural-language-is-illogical/

Livre : Neural Network Methods for Natural Language Processing, Yoav Goldberg, Bar Ilan University, avril 2017.