Reconnaissance & contrôle vocal

Debian Wheezy / KDE4

Reconnaissance et contrôle vocal avec Simon
simon.kde.org/

Matériel nécessaire : un micro de qualité correcte (micro-casque recommandé)

Pour compiler tout cela

apt-get install build-essential bison libclalsadrv-dev libxtst-dev libqwt-dev kde-workspace-dev cmake

Téléchargement & compilation de PocketSphinx 0.8 (moteur de reconnaissance vocale)
cmusphinx.sourceforge.net/wiki/download/

paquets Debian pas présents dans Wheezy, mais dans Jessie. Donc si vous êtes sous Jessie, passez directement à l’installation de Simon

cd; mkdir temp && cd temp wget http://downloads.sourceforge.net/project/cmusphinx/{sphinxbase/0.8/sphinxbase-0.8.tar.gz,pocketsphinx/0.8/pocketsphinx-0.8.tar.gz,sphinxtrain/1.0.8/sphinxtrain-1.0.8.tar.gz}
Compilation

tar xzf sphinxbase-0.8.tar.gz && pushd sphinxbase-0.8 && ./configure && make && su -c 'make install' && popd tar xzf pocketsphinx-0.8.tar.gz && pushd pocketsphinx-0.8 && ./configure && make && su -c 'make install' && popd tar xzf sphinxtrain-1.0.8.tar.gz && pushd sphinxtrain-1.0.8 && ./configure && make && su -c 'make install' && popd
(les fichiers seront installés, par défaut, dans /usr/local/… )

Téléchargement & compilation de Julius, un autre moteur de reconnaissance vocale.

wget http://jaist.dl.sourceforge.jp/julius/60273/julius-4.3.1.tar.gz tar xzf julius*.tar.gz && pushd julius-4.3.1 && ./configure && make && su -c 'make install' && popd

Simon 0.4.1

wget http://fr2.rpmfind.net/linux/KDE/stable/simon/0.4.1/src/simon-0.4.1.tar.bz2 tar xjf simon*.tar.bz2 && cd simon-0.4.1 && ./build.sh (lancera la compilation ET l’installation -le mot de passe root sera demandé- si tout s’est bien déroulé)

(Si l’opération échoue, il vous manque sans doute des dépendances, me le signaler)

A l’issue, lancer le logiciel

simon

Branchez votre micro-casque, suivez l’assistant de configuration.
Réglez le volume d’entrée du micro (attention à avoir le moins de souffle possible)

Télécharger un modèle acoustique
Configurer le modèle acoustique > Ouvrir un modèle > Télécharger

Installer le modèle “[EN/VF/JHTK] Voxforge”
(EN = Anglais, VF = VoxForge et non pas Version Française!, JHTK = Julius HTK)

Sélectionnez ce modèle dans la liste et appliquez les changements.

Télécharger un scénario
Gérer les scénario > Ouvrir > Télécharger

Pour commencer, ajouter le scénario “[EN/VF] Window management”

Essayez de prononcer quelques mots de ce scénario (par exemple : "previous window, “next window”)

Pour améliorer la reconnaissance, vous pouvez “démarrer l’entrainement” pour le scénario.

Puis testez d’autres scénarii (j’en suis à ce stade)

Pour faire la même chose en Français, il faudrait trouver les scénarii et les modèles acoustiques adaptés. :stuck_out_tongue:

N’hésitez pas à tester et partagez vos résultats! :023

cool sympa ton truc
mais est ce que tu sais s’il ont peux configurer soit même les commandes ?

C’est assez compliqué, pour être honnête. Si quelqu’un a l’envie et la patience… :stuck_out_tongue:

je regarderais ca de pret quand j’aurais le temps parceque je voulais me faire un genre d’assistant vocal
en gros une espece de truc ou tu lui dit allume la radio, monte le son etc
mais surtout je veux que le truc ecoute en permanence :slightly_smiling:

J’ai pas réutilisé le soft depuis mon tuto. Mon micro fait trop de souffle, et je trouve qu’il y a trop d’options dans tous les sens.

sinon, toujours avec CMU Sphinx
youtube.com/watch?v=jeIWu1ja-Ec

un logiciel appelé Blather
youtube.com/watch?v=gr1FZ2F7KYA

gitorious.org/blather
y’a même un script d’install pour Debian, faut tester ça :stuck_out_tongue:
paste.jonkulp.net/lolilabuje

Sinon, google chrome fait nativement la reconnaissance vocale. Mais c’est google :079

merci pour le lien
mais la vidéo ne fonctionne pas et en plus sans contexte … as tu un lien ou de la doc pour faire ca ?
c’est que utilise l’api de google me plairait bien parce qu’elle marche super bien :slightly_smiling:

[quote=“bobzer”]
mais la vidéo ne fonctionne pas et en plus sans contexte … as tu un lien ou de la doc pour faire ca ?
[/quote]j’ai édité au dessus

cool merci
je regarde ça des que je peux :slightly_smiling:

Chromium 33 permet la recherche vocale via google (forcément :stuck_out_tongue: ) mais aucunement besoin de se connecter avec un compte google (c’est louche :115 )

Y’a pas à dire c’est performant :118

salut, pas mal ton tuto, mais j’ai pas mal d’rreur. Je suis pourtant sus debian 8.5 jessise mais il ne trouve pas Pocketsphinx, pkgconfig, kdepimlibs.

j’ai reussi à installer sphinx mais pas le reste.
J’installe ca sous armbian, sur un olimex a20 lime2. ceci explique peut etre cela. si jamais tu as un peu d’aide à me proposer ! !

./build.sh
– Found Qt-Version 4.8.6 (using /usr/bin/qmake)
– Found X11: /usr/lib/arm-linux-gnueabihf/libX11.so
– Found KDE 4.12 include dir: /usr/include
– Found KDE 4.12 library dir: /usr/lib
– Found the KDE4 kconfig_compiler preprocessor: /usr/bin/kconfig_compiler
– Found automoc4: /usr/bin/automoc4
– Found Qt-Version 4.8.6 (using /usr/bin/qmake)
– Found X11: /usr/lib/arm-linux-gnueabihf/libX11.so
– Found Qwt: /usr/lib/libqwt.so
– Found libsamplerate: /usr/lib/arm-linux-gnueabihf/libsamplerate.so
CMake Warning at /usr/share/kde4/apps/cmake/modules/MacroOptionalFindPackage.cmake:32 (find_package):
By not providing “FindQAccessibilityClient.cmake” in CMAKE_MODULE_PATH this
project has asked CMake to find a package configuration file provided by
"QAccessibilityClient", but CMake did not find one.

Could not find a package configuration file provided by
"QAccessibilityClient" with any of the following names:

QAccessibilityClientConfig.cmake
qaccessibilityclient-config.cmake

Add the installation prefix of “QAccessibilityClient” to CMAKE_PREFIX_PATH
or set “QAccessibilityClient_DIR” to a directory containing one of the
above files. If “QAccessibilityClient” provides a separate development
package or SDK, be sure it has been installed.
Call Stack (most recent call first):
CMakeLists.txt:56 (macro_optional_find_package)

– Found SphinxBase
– BackendType=‘both’


– The following external packages were located on your system.
– This installation will have the extra features provided by these packages.

  • LibSampleRate - Resampling library
  • KDE PIM Libs - KDE Libraries for PIM
  • Sphinxbase - Open source toolkit for speech recognition
  • PocketSphinx - PocketSphinx is a small-footprint continuous speech recognition system
  • OpenCV - OpenCV (Open Source Computer Vision) is a library of programming functions for real time computer vision

– The following OPTIONAL packages could NOT be located on your system.
– Consider installing them to enable more features from this software.


CMake Error at po/CMakeLists.txt:9 (MESSAGE):
Please install msgmerge binary

– Configuring incomplete, errors occurred!
See also “/home/hansi/temp/simon-0.4.1/build/CMakeFiles/CMakeOutput.log”.
See also “/home/hansi/temp/simon-0.4.1/build/CMakeFiles/CMakeError.log”.

j’ai reussi à reduire les erreurs, qaccessibityclient. mais je na’rrive pas à l’installer.

hansi@lime2:~/temp/simon-0.4.1$ ./build.sh
– Found Qt-Version 4.8.6 (using /usr/bin/qmake)
– Found X11: /usr/lib/arm-linux-gnueabihf/libX11.so
– Found KDE 4.12 include dir: /usr/include
– Found KDE 4.12 library dir: /usr/lib
– Found the KDE4 kconfig_compiler preprocessor: /usr/bin/kconfig_compiler
– Found automoc4: /usr/bin/automoc4
– Found Qt-Version 4.8.6 (using /usr/bin/qmake)
– Found X11: /usr/lib/arm-linux-gnueabihf/libX11.so
– Found Qwt: /usr/lib/libqwt.so
– Found libsamplerate: /usr/lib/arm-linux-gnueabihf/libsamplerate.so
CMake Warning at /usr/share/kde4/apps/cmake/modules/MacroOptionalFindPackage.cmake:32 (find_package):
By not providing “FindQAccessibilityClient.cmake” in CMAKE_MODULE_PATH this
project has asked CMake to find a package configuration file provided by
"QAccessibilityClient", but CMake did not find one.

Could not find a package configuration file provided by
"QAccessibilityClient" with any of the following names:

QAccessibilityClientConfig.cmake
qaccessibilityclient-config.cmake

Add the installation prefix of “QAccessibilityClient” to CMAKE_PREFIX_PATH
or set “QAccessibilityClient_DIR” to a directory containing one of the
above files. If “QAccessibilityClient” provides a separate development
package or SDK, be sure it has been installed.
Call Stack (most recent call first):
CMakeLists.txt:56 (macro_optional_find_package)

– Found SphinxBase
– BackendType=‘both’


– The following external packages were located on your system.
– This installation will have the extra features provided by these packages.

  • LibSampleRate - Resampling library
  • KDE PIM Libs - KDE Libraries for PIM
  • Sphinxbase - Open source toolkit for speech recognition
  • PocketSphinx - PocketSphinx is a small-footprint continuous speech recognition system
  • OpenCV - OpenCV (Open Source Computer Vision) is a library of programming functions for real time computer vision

– The following OPTIONAL packages could NOT be located on your system.
– Consider installing them to enable more features from this software.


CMake Error at po/CMakeLists.txt:9 (MESSAGE):
Please install msgmerge binary

– Configuring incomplete, errors occurred!
See also “/home/hansi/temp/simon-0.4.1/build/CMakeFiles/CMakeOutput.log”.
See also “/home/hansi/temp/simon-0.4.1/build/CMakeFiles/CMakeError.log”.