Actions

Vous connaîtrez un mot par la compagnie qu'il tient

From Algolit

Type: Exploration Algolittéraire
Données: Frankenstein, AstroBlackness, WikiHarass, Apprendre de l'apprentissage profond, PrèsdeSaussure
Technique: plongement lexical
Développé par: word2vec de Google Tensorflow, Algolit

Vous connaîtrez un mot par la compagnie qu'il tient est une série de 5 paysages basés sur différents ensembles de données. Chaque paysage comprend les mots «human», «learning», «system» en compagnie de différents groupes sémantiques. L'intuition que les distances au sein du graphique sont liées à la similarité sémantique des mots est l'un des fondements de word2vec.

Les graphiques sont le résultat d'une étude de code basée sur un script de tutoriel de plongement lexical existant word2vec_basic.py. Dans une pratique d'apprentissage automatique, ces graphiques fonctionnent comme des outils de validation pour voir si un modèle commence à avoir du sens. Il est intéressant de voir comment ce processus de validation est alimenté par la compréhension sémantique individuelle des groupes et des mots.

Comment pouvons-nous utiliser ces paysages sémantiques comme outils de lecture?

graphique 1: Frankenstein

Inclut le livre Frankenstein, ou le Prométhée Moderne de Mary Shelley.

loss value: 4.45983128536
Nearest to human: fair, active, crevice, sympathizing, pretence, fellow, nightingale, productions, deaths, medicine,
Nearest to learning: steeple, clump, electricity, security, foretaste, fluctuating, finding, gazes, pour, decides,
Nearest to system: philosophy, coincidences, threatening, selfcontrol, distinctly, babe, stream, chimney, recess, accounts,

Detail-frankenstein.png 5 graphs frankenstein gutenberg tf.png

graphique 2: AstroBlackness

Une sélection de textes avec une perspective afrofuturiste.

loss value: 5.8195698024
Nearest to human: black, difference, white, gender, otherwise, 3, 7, ignorance, contemporary, greater,
Nearest to learning: superior, truth, function, lens, start, dying, existence, changing, symbol, place,
Nearest to system: attempts, adapt, programmed, varieties, limit, realization, color, promise, population, voice,

Detail-astroBlackness.png 5 graphs astroBlackness.png

graphique 3: PrèsdeSaussure

Inclut trois livres secondaires sur l'oeuvre de Saussure en linguistique structuraliste.

loss value: 5.78265964687
Nearest to human: cultural, 181, psychic, Human, rational, physical, story, chance, domain, furthermore,
Nearest to system: structure, content, community, System, term, center, study, plurality, form, value,

Le mot 'learning' n'était pas présent dans la liste des 5000 mots les plus communs.

Detail-nearbySaussure.png 5 graphs nearbySaussure.png

graphique 4: Apprendre de l'apprentissage profond

Inclut sept livres sur le sujet de l'apprentissage en profondeur.

loss value: 6.65393904257
Nearest to human: healthy, given, modeling, poorly, inspired, criterion, specifically, Accuracy, surface, predicting,
Nearest to learning: Learning, pretrained, sparse, neat, 21, inference, tuning, adagrad, tested, Use,
Nearest to system: UNK, roi, dataframe, code, win, page, approach, diagonal, cae, letter,

Detail-learning-deep-learning.png 5 graphs deep-learning-trainingset.png

graphique 5: WikiHarass

Inclut des exemples de harcèlement sur les commentaires de la page Talk de Wikipedia.

loss value: 3.93717244664
Nearest to human: jacob, Persianyes, phrase, track, star, attack, puts, jews, helps, plastic,
Nearest to learning: sound, people, getting, writing, thinking, talking, thoughts, modify, less, prince,
Nearest to system: armenian, UNK, georgia, george, n, developed, its, each, daniele, claim,

Detail-WikiHarass.png 5 graphs Talk page comments from Wikipedia stripped.png