das buch
...
autoren und themen
...
aktuelles

Buchdeckel

Computerlinguistik und Sprachtechnologie – Eine Einführung

Spracherkennungssysteme




Eine kleine Auswahl verwandter Seiten

Projekte
Verbmobil Öffentlich (BMBF) gefördertes Projekt. Bereits abgeschlossen.
Smartkom Nachfolgeprojekt: ebenfalss öffentlich (BMBF) gefördert.

Produkte
Hidden Markov Model Toolkit (HTK)  Umfangreiches Spracherkennungspaket.
Temic Sprachverarbeitung Weltmarktführer für Sprachbedienung im automotive Markt.

Daten
Linguistic Data Consortium
Bayerisches Archiv für Sprachsignale (BAS)
International Phonetic Association (IPA)
SAMPA-computer readable phonetic alphabet

Organisationen
International Speech Communication Association (ISCA)
European Language Resources Association (ELRA)

Noch mehr Links


Erweiterte Literaturliste zum Artikel im Buch
Überblick  RobustheitAlternative Ansätze  SprachmodellierungAnwendungen
 

Überblick

 Bahl, Lalit R.,  Jelinek, F., und Robert L. Mercer (1983).
   A maximum likelihood approach to continuous speech recognition.
   IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-5(2):179-190, March.

 Furui, S. (1989).
   Digital Speech Processing, Synthesis, and Recognition.
   Marcel Dekker. New York und Basel.

 Huang, Xuedong D.,  Y. Ariki  und   M. A. Jack  (1990).
   Hidden Markov models for speech recognition.
   Edinburgh information technology series. Edinburgh University Press, Schottland.

 Lee, Kai-Fu  (1989).
   Automatic Speech Recognition: The Development of the SPHINX System.
   Kluwer Academic Publishers, Boston, USA.

 Rabiner, L.R.  (1989).
   A tutorial on Hidden Markov Models and Selected Applications in Speech Recognition.
   Proc. of the IEEE, 77(2):257-285.

 Rabiner, L.R. und B.-H. Juang  (1993).
    Fundamentals of Speech Recognition.
    Prentice Hall Signal Processing Series.
    Prentice-Hall, Englewood Cliffs, USA.

 Ruske, Günther  (1988).
   Automatische Spracherkennung: Methoden der Klassifikation und  Merkmalsextraktion.
   Einführung in die Nachrichtentechnik.
   Oldenbourg Verlag, München,  Deutschland.

 Schukat-Talamazzini, E. G.  (1995).
    Automatische Spracherkennung.
    Vieweg Verlag, Braunschweig, Deutschland.

 Young, S. und Bloothooft, G. (1997)
   Corpus-based Methods in Language and Speech Processing.
   Kluwer Academic Publishers, Boston, USA.
 

Robustheit

 Acero, Alejandro  (1990).
   Acoustical and environmental robustness in automatic speech recognition.
   Carnegie Mellon University, USA.

 Fant, Gunnar  (1960).
   The Acoustic Theory of Speech Production.
   Mouton & Co., Den Haag, Niederlande.

 Junqua, Jean-Claude  und  L.-P. Haton  (1996).
   Robustness in automatic speech recognition. Fundamentals and  applications.
   Kluwer Academic Publishers, Boston, USA.

 Legetter, Chris J.  (1995).
   Improved Acoustic Modeling for HMMs using Linear Transformations.
   University of Cambridge, England.
 

Alternative Ansätze

 Bourlard, H. A. und Morgan, N. (1994).
   Connectionist speech recognition - a hybrid approach.
   Kluwer Academic Publishers.

 Sakoe, H. und S. Chiba  (1978).
   Dynamic programming algorithm optimization for spoken word recognition.
   IEEE Transactions on Speech and Audio Processing, 26(1):43-49.

 Schürmann, Jürgen  (1977).
   Polynomklassifikatoren für die Zeichenerkennung.
   Oldenbourg Verlag, München, Deutschland.
 

Sprachmodellierung

 Jelinek, F (1990).
   Self-organized language modeling for speech recognition.
   In A. Waibel and K. Lee, editors, Readings in speech recognition, 450--506.
   Morgan Kaufmann Publishers.

 Katz, S.M.  (1987).
   Estimation of Probabilities from Sparse Data for the Language Model Component of a Speech Recognizer.
   IEEE Transactions on Speech and Audio Processing, 35(3):400-401.

Anwendungen

  Markowitz, Judith A.  (1996).
   Using Speech Recognition.
   Prentice Hall, Upper Saddle River, USA.

 Susen, Axel (1999).
   Spracherkennung: Kosten, Nutzen, Einsatzmöglichkeiten.
   VDE Verlag. Berlin, Offenbach.

 Wahlster, Wolfgang  (1993).
   Verbmobil-Translation of Face-to-Face Dialogues.
   Proc. EUROSPEECH'93 , 29--38, Berlin, Deutschland.
 



Der Autor
 
CV
Der Autor ist Jahrgang 1968 und hat nach dem Abitur Wirtschaftsmathematik mit Schwerpunkt Statistik/Operations Research an der Universität Ulm studiert. Im Anschluß daran ist er 1994 an das Forschungsinstitut von Daimler-Benz (heute DaimlerChrysler) gewechselt, um dort in der Abteilung für Sprachverstehende Systeme seine Dissertation zum Thema
Sprecheradaption in einem Spracherkennungssystem anzufertigen. Seit Abschluss der Promotion 1998 ist er dort als wissenschaftlicher Mitarbeiter tätig.
Adresse
Dr. Udo Haiber
DaimlerChrysler AG
Sprachverstehende Systeme (FT3/AV)
Postfach 2360
89013 Ulm

Besucher:  Wilhelm-Runge-Str. 11, Ulm/Donau
fon   ++49 (0) 731 505 2347
fax   ++49 (0) 731 505 4105
email udo.haiber@daimlerchrysler.com


Institut für Informatik der Uni Zürich, Abt. Computerlinguistik, Dienstag, 19. März 2002 (Kai-Uwe Carstensen)

das buch
...
autoren und themen
...
aktuelles