Spracherkennungssysteme
Eine kleine Auswahl verwandter Seiten
Projekte
Verbmobil Öffentlich (BMBF)
gefördertes Projekt. Bereits abgeschlossen.
Smartkom Nachfolgeprojekt: ebenfalss
öffentlich (BMBF) gefördert.
Produkte
Hidden Markov Model Toolkit (HTK)
Umfangreiches Spracherkennungspaket.
Temic Sprachverarbeitung Weltmarktführer
für Sprachbedienung im automotive Markt.
Daten
Linguistic Data Consortium
Bayerisches
Archiv für Sprachsignale (BAS)
International Phonetic
Association (IPA)
SAMPA-computer
readable phonetic alphabet
Organisationen
International Speech Communication
Association (ISCA)
European Language Resources
Association (ELRA)
Noch
mehr Links
Erweiterte Literaturliste zum Artikel
im Buch
Überblick RobustheitAlternative
Ansätze SprachmodellierungAnwendungen
Überblick
Bahl, Lalit R., Jelinek, F., und Robert L. Mercer (1983).
A maximum likelihood approach to continuous speech
recognition.
IEEE Transactions on Pattern Analysis and Machine Intelligence,
PAMI-5(2):179-190, March.
Furui, S. (1989).
Digital Speech Processing, Synthesis, and Recognition.
Marcel Dekker. New York und Basel.
Huang, Xuedong D., Y. Ariki und M. A.
Jack (1990).
Hidden Markov models for speech recognition.
Edinburgh information technology series. Edinburgh University
Press, Schottland.
Lee, Kai-Fu (1989).
Automatic Speech Recognition: The Development of the
SPHINX System.
Kluwer Academic Publishers, Boston, USA.
Rabiner, L.R. (1989).
A tutorial on Hidden Markov Models and Selected Applications
in Speech Recognition.
Proc. of the IEEE, 77(2):257-285.
Rabiner, L.R. und B.-H. Juang (1993).
Fundamentals of Speech Recognition.
Prentice Hall Signal Processing Series.
Prentice-Hall, Englewood Cliffs, USA.
Ruske, Günther (1988).
Automatische Spracherkennung: Methoden der Klassifikation
und Merkmalsextraktion.
Einführung in die Nachrichtentechnik.
Oldenbourg Verlag, München, Deutschland.
Schukat-Talamazzini, E. G. (1995).
Automatische Spracherkennung.
Vieweg Verlag, Braunschweig, Deutschland.
Young, S. und Bloothooft, G. (1997)
Corpus-based Methods in Language and Speech Processing.
Kluwer Academic Publishers, Boston, USA.
Robustheit
Acero, Alejandro (1990).
Acoustical and environmental robustness in automatic
speech recognition.
Carnegie Mellon University, USA.
Fant, Gunnar (1960).
The Acoustic Theory of Speech Production.
Mouton & Co., Den Haag, Niederlande.
Junqua, Jean-Claude und L.-P. Haton (1996).
Robustness in automatic speech recognition. Fundamentals
and applications.
Kluwer Academic Publishers, Boston, USA.
Legetter, Chris J. (1995).
Improved Acoustic Modeling for HMMs using Linear Transformations.
University of Cambridge, England.
Alternative Ansätze
Bourlard, H. A. und Morgan, N. (1994).
Connectionist speech recognition - a hybrid approach.
Kluwer Academic Publishers.
Sakoe, H. und S. Chiba (1978).
Dynamic programming algorithm optimization for spoken
word recognition.
IEEE Transactions on Speech and Audio Processing, 26(1):43-49.
Schürmann, Jürgen (1977).
Polynomklassifikatoren für die Zeichenerkennung.
Oldenbourg Verlag, München, Deutschland.
Sprachmodellierung
Jelinek, F (1990).
Self-organized language modeling for speech recognition.
In A. Waibel and K. Lee, editors, Readings in speech recognition,
450--506.
Morgan Kaufmann Publishers.
Katz, S.M. (1987).
Estimation of Probabilities from Sparse Data for the Language
Model Component of a Speech Recognizer.
IEEE Transactions on Speech and Audio Processing, 35(3):400-401.
Anwendungen
Markowitz, Judith A. (1996).
Using Speech Recognition.
Prentice Hall, Upper Saddle River, USA.
Susen, Axel (1999).
Spracherkennung: Kosten, Nutzen, Einsatzmöglichkeiten.
VDE Verlag. Berlin, Offenbach.
Wahlster, Wolfgang (1993).
Verbmobil-Translation of Face-to-Face Dialogues.
Proc. EUROSPEECH'93 , 29--38, Berlin, Deutschland.
Der Autor
CV
Der Autor ist Jahrgang 1968 und hat nach dem Abitur Wirtschaftsmathematik
mit Schwerpunkt Statistik/Operations Research an der Universität Ulm
studiert. Im Anschluß daran ist er 1994 an das Forschungsinstitut
von Daimler-Benz (heute DaimlerChrysler) gewechselt, um dort in der Abteilung
für Sprachverstehende Systeme seine Dissertation zum Thema
Sprecheradaption in einem Spracherkennungssystem anzufertigen. Seit
Abschluss der Promotion 1998 ist er dort als wissenschaftlicher Mitarbeiter
tätig. |
Adresse
Dr. Udo Haiber
DaimlerChrysler AG
Sprachverstehende Systeme (FT3/AV)
Postfach 2360
89013 Ulm
Besucher: Wilhelm-Runge-Str. 11, Ulm/Donau
fon ++49 (0) 731 505 2347
fax ++49 (0) 731 505 4105
email udo.haiber@daimlerchrysler.com
|