Linguistique : reprise des hostilités


23 mai 2011

Hormis le fait que pour une personne maniant tellement bien les notions de syntaxe et de sémantique son site n'en constitue pas la preuve (et loin de là...) ce qui est une gageure à la limite du honteux, Fabienne Venant dispose de beaucoup d'articles qui m'ont passionné.

Parmi ceux-ci, Géométriser le sens lexical. La synonymie comme accès à la sémantique qui m'a prouvé que des gens étaient intéressé par des choses qui me titillent également. J'ai l'impression que sa thèse est bien aussi, mais là il va falloir potasser un peu plus, et j'ai un métier moi :) (Excuse moisie d'un jaloux, on aura compris)

Pour terminer cette petite brève, j'ai trouvé un autre PDF qui discute des néologismes et de leurs détections automatique possibles (duh !) et, si l'article est intéressant parce que précis, il expose le fonctionnement de l'ATILF en général et de certaines équipes en particulier. J'aurai beaucoup à y redire (j'ai l'impression que peu de personnes férues d'informatique sont à compter parmi les membres de l'ATILF) mais ça a le mérite d'exister. On peut critiquer la recherche en France mais surtout au niveau de l'encadrement, les chercheurs eux-mêmes sont apparemment des passionnés, ça fait plaisir à voir.

La sémantique (en construction)


5 avril 2009

Liste des verbes

Pour reprendre (tous) les verbes de la langue française :

wget -q "http://conjf.cactus2000.de/index.fr.php?begin=a&end=zzzzz" -O - | grep '\[' | grep '<a' | php -r '$in=file_get_contents("php://stdin"); preg_match_all("/>([^<]+) \[.*\]<\/a/", $in, $Matches); foreach ($Matches[1] as $item) { echo "INSERT INTO Verbs (id, name) values (0, \"".$item."\");\n";}' | mysql --user root -p testverbs

Ã? suivre

Il faut envoyer des requêtes utilisant les produits précédent à un script qui interrogerait un site comme le conjugueur.com :

for item in `mysql --user root -p 'select name from Verbs;'`; do wget 'http://www.leconjugueur.com/php5/index.php?v=`echo $item | tr A-Z a-z`' | storeConjugue
Accueil