Dieses von Philips zur Verfügung gestellte System wurde zuerst zur Steuerung von Mobiltelefonen eingesetzt. Mittlerweile wird es auch in den Bereichen der Autonavigationssysteme oder sprachsteuerbaren Küchengeräte verwendet. Ein großer Vorteil dieses Systems ist die Möglichkeit des Keyword Spotting. Der Erkenner ist in der Lage, einzelne Wörter im kontinuierlichen Signal zu extrahieren. Dadurch kann eine zufriedenstellende Erkennungsleistung erreicht werden, ohne ein vollständiges LM angegeben zu haben. Eine Möglichkeit wäre zum Beispiel das Weglassen von Artikeln und Höflichkeitsfloskeln. Bei dem folgenden Beispiel für eine Keyword-Grammatik bezeichnet den Startzustand. Die gestrichelten Linien sollen weitere hier nicht betrachtete Übergänge andeuten.
Die Modellierungen unter Beachtung des Keyword Spotting haben zwar zu verwendbaren Ergebnissen geführt, es wird aber trotzdem ein ''vollständiges'' Modell verwendet, da es für den I6-Erkenner sowieso erstellt werden muß. Dies kann aber im Gegensatz zu dem I6 Erkenner in minimierter Form angegeben werden. Dadurch kann die Anzahl der benötigten Zustände recht gering gehalten werden (siehe 6.2.1). Für die akustische Ebene stehen mehrere vortrainierte Phonemmodelle zur Auswahl. Dies sind verschiedene Monophonkorpora und ein Triphonkorpus. Die besten Ergebnisse liefert das Triphonmodell. Die Erstellung des akustischen bzw. linguistischen Modells kann sehr einfach über eine Auswahl von unterstützenden Programmen erzeugt und optimiert werden (siehe Anhang B und C).
Die Nachteile dieses Erkenners sind vor allem die Begrenzungen des Vokabulars auf ca. 250 Wörter und der Grammatik auf ca. 500 Zustände. Größere Modelle werden zwar verarbeitet, führen aber zu inakzeptablen Antwortzeiten des Systems. Ein Nachteil, der aufgrund des fehlenden Trainingsmaterials nicht zum Tragen kommt, ist das Fehlen der Möglichkeit, das LM als stochastischen Automaten bzw. -Gramm Modell angeben zu können.