preloadImage preloadImage
Diese Webseite verwendet Cookies zur Verbesserung des Angebots und für Marketingzwecke. Durch die Nutzung unserer Seiten erklären Sie sich damit einverstanden. Mehr erfahren. OK
UNTERNEHMEN APP ENTWICKLUNG WEBENTWICKLUNG SOFTWAREENTWICKLUNG BLOCKCHAIN REFERENZEN BLOG JOBS KONTAKT

Individuelle Alexa Skill Entwicklung für Ihr Unternehmen

Individuelle Alexa Skill Entwicklung für Ihr Unternehmen

Mehr Kunden durch innovative Sprachsteuerung – Wer oder was ist Alexa?

Alexa ist der Name des sprachgesteuerten, digitalen Assistenzsystems aus dem Hause Amazon. Auf der hauseigenen Plattform gibt es die Alexa-Geräte in derzeit 4 Ausführungen, die Hauptunterschiede sind jeweils die Größe und das Vorhandensein eines Displays.


 

Was sind Alexa Skills?

Alexa selbst kann schon aufgrund der vielfältigen Bereiche der Amazon Web Services (kurz: AWS) viele Fragen beantworten. Doch für alles was Alexa noch nicht von Anfang an kann, gibt es die Alexa Skills. Man kann sich die Skills wie Apps für Smartphones vorstellen. Jeder Skill erweitert die eigene Alexa um eine Fähigkeit, wie zum Beispiel das Vorlesen der aktuellen Tagesschau.

Die Aktivierung der Skills folgt dabei einem einfachen Muster. Hier ein kleines Beispiel: "Alexa, bitte Gitarre lernen ein tiefes E zu spielen." Alexa ist das Aktivierungswort um die Spracherkennung zu starten. Danach folgt die Auswahl des Skills, in diesem Falle "Gitarre lernen". Zum Schluss wird durch die sogenannte "Utterance" die eigentliche Funktion gestartet, in diesem Falle eine Note wiederzugeben.


 

Wie funktionieren Alexa Interna?

Jeder Skill baut auf einem Modell auf. Das Modell gibt die User-Interaktion vor. Jedes Modell bietet verschiedene Methoden (auch Intents genannt) an, um Funktionen aufzurufen. Die Intents "Pause" und "Abbrechen" müssen immer vorhanden sein, alles weitere richtet sich nach dem Zweck des Skills.

Da ein Intent schnell komplex werden kann, gibt es hier weitere Aufteilungen. Utterance - ist mehr oder weniger alles was nach "Gitarre lernen" folgt, hierdurch wird der Intent ausgewählt. Weitere Beispiele könnten sein "ein D zu spielen" oder "spiele ein hohes E". Mit Hilfe von Parametern, sog. Slots kann die Unterteilung der einzelnen Noten erfolgen. Es können auch mehrere Slots in einer Utterance genutzt werden "spiele ein [Slot] [Slot]" wie in "spiele ein tiefes/hohes E".

Die Utterances werden also genutzt um möglichst alle Grammatiken abzubilden, mit denen ein Intent aufgerufen werden kann. Um nicht jede Utterance mit jeder Note neu abzubilden werden Slots als Platzhalter genutzt. Eine Faustregel lautet: pro Intent sollten zwischen 7 und 30 Uttarances bereitgestellt werden.

Ist ein Modell fertiggestellt, kann im Backend mit der Logik angefangen werden. Die Funktionen aus dem Modell liefern also die gewünschten Antworten. Die Logik wird zumeist mit Node.js umgesetzt. Es gibt auch ein Projekt (phlexa) um die Logik mit PHP umsetzen zu können, dieses befindet sich jedoch noch in einer frühen Phase.

Ist die Logik fertig, muss sie nur noch ausgegeben werden. Antworten können um Sprechgeschwindigkeit und Betonungen erweitert werden. Es können ebenfalls Audio und/oder Video-Dateien abgespielt werden, wenn diese vorher richtig konvertiert und verfügbar gemacht wurden.

Mittlerweile lassen sich einfache Skills per Vorgabe erstellen, sog. Blueprints. Allerdings stehen diese nur auf den Geräten zur Verfügung, die mit der eigenen Email-Adresse verknüpft sind. Vorgefertigte Baukästen stehen u. a. für Trivia, "Dad Jokes", Jungeselinnen-Abschiedsparties, Aufgabenplaner und Lernkarten zur Verfügung.


 

Wie sollte ein Alexa Skill aufgebaut werden?

Beim Konzipieren eines Skills gibt es einiges zu beachten. Nehmen wir als Beispiel einen Skill für ein Restaurant. Eine gute Möglichkeit wäre, wenn man das Tagesgericht erfragen könnte. Eine schlechte, welche Gerichte es insgesamt gibt. In diesem Fall kann es für den Nutzer sehr schnell anstrengend werden zuzuhören, wie Alexa die gesamte Speisekarte vorliest. Die Frage nach dem Tagesgericht hingegen ist zielgerichtet und kann schnell und einfach beantwortet werden.

Die gesamte Interaktionskette, also alle Frage- und Antwortvariationen sollten bereits im Vorfeld feststehen, um das Modell so gut wie möglich aufbauen zu können. Auch sollten die Antworten Variationen bieten, um nicht zu monoton zu wirken. Das Ziel ist es, ein möglichst natürliches Gespräch abzubilden.

Die Möglichkeiten die sich für Ihre Anwendung hieraus ergeben sind vielfältig. Wir helfen Ihnen bei der Konzeptionierung und beraten Sie gerne über sinnvolle Anwendungsfälle, um die Alexa Sprachsteuerung auch in Ihrer Anwendung zu integrieren. Nehmen Sie unverbindlich Kontakt mit uns auf, oder rufen Sie uns gerne an.

12.02.2019

Sie möchten mehr erfahren und ein unverbindliches Angebot?

Ihr Ansprechpartner: Michael Siedenbiedel
Ihr Ansprechpartner

Michael Siedenbiedel
Telefon +49 (0)2381 92 92 799
E-Mail info@fkt42.de

Ich berate Sie gern und freue mich, von Ihnen zu hören.


* Wir behandeln Ihre Daten vertraulich und verschicken keine Werbung!

Weitere Beiträge aus unserem Blog
Das Minimum Viable Product – mit Minimalismus zum Erfolg
Das Minimum Viable Product – mit Minimalismus zum Erfolg
Mit dem Minimum Viable Product Entwicklungskosten sparen, Risiken minimieren und Zeit gewinnen ✓ FKT42 zeigt wie das geht.
14.06.2019
App-Entwicklung: Nativ, Web, Hybrid oder Cross-Plattform
App-Entwicklung: Nativ, Web, Hybrid oder Cross-Plattform
Native App, Hybride App, Cross-Plattform oder Web App – Für Ihr Projekt die richtige Art der Programmierung wählen ✓ mit FKT42.
07.06.2019
Machine Learning: einfach zufriedene Kunden
Machine Learning: einfach zufriedene Kunden
Machine Learning – Kosten sparen und Kundenzufriedenheit steigern ✓ Mit FKT42 Machine Learning erfolgreich und einfach umsetzen.
21.05.2019
FKT42 GmbH • Münsterstraße 5 • 59065 Hamm • Mail: info@fkt42.de • Tel.: +49 (0)2381 92 92 799