preloadImage preloadImage
Diese Webseite verwendet Cookies zur Verbesserung des Angebots und für Marketingzwecke. Durch die Nutzung unserer Seiten erklären Sie sich damit einverstanden. Mehr erfahren. OK
UNTERNEHMEN APP ENTWICKLUNG WEBENTWICKLUNG SOFTWAREENTWICKLUNG BLOCKCHAIN REFERENZEN BLOG JOBS KONTAKT

Individuelle Alexa Skill Entwicklung für Ihr Unternehmen

Individuelle Alexa Skill Entwicklung für Ihr Unternehmen

Mehr Kunden durch innovative Sprachsteuerung – Wer oder was ist Alexa?

Alexa ist der Name des sprachgesteuerten, digitalen Assistenzsystems aus dem Hause Amazon. Auf der hauseigenen Plattform gibt es die Alexa-Geräte in derzeit 4 Ausführungen, die Hauptunterschiede sind jeweils die Größe und das Vorhandensein eines Displays.

Was sind Alexa Skills?

Alexa selbst kann schon aufgrund der vielfältigen Bereiche der Amazon Web Services (kurz: AWS) viele Fragen beantworten. Doch für alles was Alexa noch nicht von Anfang an kann, gibt es die Alexa Skills. Man kann sich die Skills wie Apps für Smartphones vorstellen. Jeder Skill erweitert die eigene Alexa um eine Fähigkeit, wie zum Beispiel das Vorlesen der aktuellen Tagesschau.

Die Aktivierung der Skills folgt dabei einem einfachen Muster. Hier ein kleines Beispiel: "Alexa, bitte Gitarre lernen ein tiefes E zu spielen." Alexa ist das Aktivierungswort um die Spracherkennung zu starten. Danach folgt die Auswahl des Skills, in diesem Falle "Gitarre lernen". Zum Schluss wird durch die sogenannte "Utterance" die eigentliche Funktion gestartet, in diesem Falle eine Note wiederzugeben.

Wie funktionieren Alexa Interna?

Jeder Skill baut auf einem Modell auf. Das Modell gibt die User-Interaktion vor. Jedes Modell bietet verschiedene Methoden (auch Intents genannt) an, um Funktionen aufzurufen. Die Intents "Pause" und "Abbrechen" müssen immer vorhanden sein, alles weitere richtet sich nach dem Zweck des Skills.

Da ein Intent schnell komplex werden kann, gibt es hier weitere Aufteilungen. Utterance - ist mehr oder weniger alles was nach "Gitarre lernen" folgt, hierdurch wird der Intent ausgewählt. Weitere Beispiele könnten sein "ein D zu spielen" oder "spiele ein hohes E". Mit Hilfe von Parametern, sog. Slots kann die Unterteilung der einzelnen Noten erfolgen. Es können auch mehrere Slots in einer Utterance genutzt werden "spiele ein [Slot] [Slot]" wie in "spiele ein tiefes/hohes E".

Die Utterances werden also genutzt um möglichst alle Grammatiken abzubilden, mit denen ein Intent aufgerufen werden kann. Um nicht jede Utterance mit jeder Note neu abzubilden werden Slots als Platzhalter genutzt. Eine Faustregel lautet: pro Intent sollten zwischen 7 und 30 Uttarances bereitgestellt werden.

Ist ein Modell fertiggestellt, kann im Backend mit der Logik angefangen werden. Die Funktionen aus dem Modell liefern also die gewünschten Antworten. Die Logik wird zumeist mit Node.js umgesetzt. Es gibt auch ein Projekt (phlexa) um die Logik mit PHP umsetzen zu können, dieses befindet sich jedoch noch in einer frühen Phase.

Ist die Logik fertig, muss sie nur noch ausgegeben werden. Antworten können um Sprechgeschwindigkeit und Betonungen erweitert werden. Es können ebenfalls Audio und/oder Video-Dateien abgespielt werden, wenn diese vorher richtig konvertiert und verfügbar gemacht wurden.

Mittlerweile lassen sich einfache Skills per Vorgabe erstellen, sog. Blueprints. Allerdings stehen diese nur auf den Geräten zur Verfügung, die mit der eigenen Email-Adresse verknüpft sind. Vorgefertigte Baukästen stehen u. a. für Trivia, "Dad Jokes", Jungeselinnen-Abschiedsparties, Aufgabenplaner und Lernkarten zur Verfügung.

Wie sollte ein Alexa Skill aufgebaut werden?

Beim Konzipieren eines Skills gibt es einiges zu beachten. Nehmen wir als Beispiel einen Skill für ein Restaurant. Eine gute Möglichkeit wäre, wenn man das Tagesgericht erfragen könnte. Eine schlechte, welche Gerichte es insgesamt gibt. In diesem Fall kann es für den Nutzer sehr schnell anstrengend werden zuzuhören, wie Alexa die gesamte Speisekarte vorliest. Die Frage nach dem Tagesgericht hingegen ist zielgerichtet und kann schnell und einfach beantwortet werden.

Die gesamte Interaktionskette, also alle Frage- und Antwortvariationen sollten bereits im Vorfeld feststehen, um das Modell so gut wie möglich aufbauen zu können. Auch sollten die Antworten Variationen bieten, um nicht zu monoton zu wirken. Das Ziel ist es, ein möglichst natürliches Gespräch abzubilden.

Die Möglichkeiten die sich für Ihre Anwendung hieraus ergeben sind vielfältig. Wir helfen Ihnen bei der Konzeptionierung und beraten Sie gerne über sinnvolle Anwendungsfälle, um die Alexa Sprachsteuerung auch in Ihrer Anwendung zu integrieren. Nehmen Sie unverbindlich Kontakt mit uns auf, oder rufen Sie uns gerne an.

12.02.2019
Weitere Beiträge aus unserem Blog
Mitarbeiter App – interne Kommunikation im Unternehmen
Mitarbeiter App – interne Kommunikation im Unternehmen
Individuelle Mitarbeiter App für Ihr Unternehmen ► Bessere Unternehmenskommunikation, Mitarbeitermotivation und Kostenersparnis
20.11.2019
Präventiver Schutz vor verschiedenen Arten von Hackerangriffen
Präventiver Schutz vor verschiedenen Arten von Hackerangriffen
Distributed-Denial-of-Service (DDoS) – SQL-Injection – Code-Injection – Cross Site Scripting ► So schützen Sie Ihr Unternehmen.
08.11.2019
Big Data Analytics | Datenmissbrauch oder Kundenbindung?
Big Data Analytics | Datenmissbrauch oder Kundenbindung?
Big Data: Chancen und Risiken, die Sie kennen sollten ✔ Daten als wertvollste Ressource ➤ Wie eine Datenflut die Welt verändert.
24.10.2019
FKT42 GmbH • Münsterstraße 5 • 59065 Hamm • Mail: info@fkt42.de • Tel.: +49 (0)2381 92 92 799