Viele von uns kennen den Satz „Hey Google“ nur zu gut. Er war jahrelang der Schlüssel zu unserem digitalen Helfer auf Android-Smartphones. Doch die Technologie entwickelt sich weiter, und Google läutet nun eine neue Ära ein: Der Google Assistent wird schrittweise durch Gemini ersetzt, einen Sprachassistenten, der von leistungsstarker Künstlicher Intelligenz angetrieben wird.
Was bedeutet das für Sie? Lassen Sie mich das Schritt für Schritt und ganz einfach erklären. Ich habe ein Smartphone Samsung Galaxy A53 5G. Auf diesem Smartphone habe ich Gemini installiert und getestet.
Was ist ein Sprachassistent?
Stellen Sie sich einen persönlichen Helfer vor, der in Ihrem Smartphone oder Tablet wohnt. Sie können mit ihm sprechen, ihm Fragen stellen oder Aufgaben geben. Ein Sprachassistent ist genau das: eine Software, die Ihre gesprochene Sprache versteht und darauf reagiert. Er kann für Sie Informationen suchen, Termine eintragen, Timer stellen oder einfach nur einen Witz erzählen – alles auf Zuruf.
Warum sind Sprachassistenten sinnvoll?
Der größte Vorteil von Sprachassistenten ist die Zeitersparnis und der Komfort. Statt Ihr Handy zu entsperren, eine App zu suchen, den Webbrowser zu öffnen und eine Suchanfrage zu tippen, können Sie einfach fragen: „Hey Google, wie wird das Wetter morgen?“
Informationen sind sofort zur Hand, ohne dass Sie Ihre Hände benutzen oder sich durch Menüs klicken müssen. Das ist besonders praktisch, wenn Sie gerade kochen, einkaufen oder einfach nur die Hände voll haben.
Was ist Künstliche Intelligenz (KI)?
Sie haben sicher schon von „KI“ gehört. Das ist die Abkürzung für Künstliche Intelligenz. Vereinfacht gesagt, ist KI der Versuch, Computern beizubringen, wie Menschen zu denken und zu lernen.
Ein normaler Computer folgt nur starren Befehlen. Eine KI hingegen kann Zusammenhänge erkennen, aus Erfahrungen lernen, kreativ sein und sogar komplexe Probleme lösen. Sie versteht nicht nur, was Sie sagen, sondern auch, was Sie meinen könnten.
Aus Kommandos werden Prompts
Hier liegt der größte Unterschied zwischen dem alten Google Assistent und dem neuen Gemini.
- Beim Google Assistenten haben wir Kommandos gegeben. Das waren klare, einfache Anweisungen wie: „Stelle den Wecker auf 7 Uhr.“ oder „Spiele Musik von den Ärzten.“
- Bei Gemini verwenden wir Prompts. Ein Prompt ist mehr als ein Befehl – es ist eine Aufforderung oder der Beginn eines Gesprächs. Sie können viel komplexere und kreativere Anfragen stellen.
Beispiel:
- Kommando (alt): „Zeige mir Pizzerien in meiner Nähe.“
- Prompt (neu): „Plane mir einen schönen Abend für zwei Personen. Finde ein gut bewertetes italienisches Restaurant in der Nähe, das nicht zu teuer ist, und schlage danach eine Bar für einen Cocktail vor.“
Gemini kann also mitdenken, planen und Ihnen kreative Vorschläge machen.
Gemini auf einem Android-Gerät installieren
Die Installation von Gemini auf Ihrem Android-Smartphone oder -Tablet ist kinderleicht:
- Öffnen Sie den Google Play Store auf Ihrem Gerät.
- Suchen Sie nach der App „Google Gemini“.
- Tippen Sie auf „Installieren“ oder, falls Sie den Google Assistant bereits nutzen, eventuell auf „Aktualisieren“.
- Nach der Installation werden Sie beim ersten Öffnen gefragt, ob Gemini den Google Assistenten ersetzen soll. Bestätigen Sie dies, um die neuen KI-Funktionen zu nutzen.
Gemini aufrufen – So einfach geht’s
Es gibt mehrere Wege, um mit Gemini zu sprechen. Wählen Sie den, der für Sie am bequemsten ist:
- Per Sprachbefehl: „Hey Google“ Die klassische Methode bleibt erhalten. Sagen Sie einfach „Hey Google“, gefolgt von Ihrer Frage. Das funktioniert sogar, wenn der Bildschirm ausgeschaltet ist (sofern aktiviert).
- Langes Drücken der Power-TasteBei vielen neueren Android-Geräten (insbesondere Google Pixel) öffnet ein langes Drücken der Ein-/Ausschalttaste direkt Gemini statt des Ausschaltmenüs.
- Wischen von der BildschirmeckeWenn Sie die Gestensteuerung (ohne die drei Buttons am unteren Rand) nutzen, wischen Sie einfach diagonal von der linken oder rechten unteren Ecke zur Mitte des Bildschirms.
- Über die Gemini-AppWie jede andere App können Sie auch Gemini direkt starten, indem Sie auf das App-Symbol tippen. Hier können Sie auch tippen, Bilder hochladen und frühere Gespräche ansehen.
- Langes Drücken des Home-ButtonsNutzen Sie noch die klassische 3-Button-Navigation am unteren Bildschirmrand? Dann halten Sie einfach den Home-Button (den Kreis in der Mitte) gedrückt, um Gemini zu starten.
Sprachassistent Gemini: Ein Plus für die Barrierefreiheit
Ein herausragendes Merkmal von Gemini ist, dass es von Grund auf mit dem Gedanken an Barrierefreiheit entwickelt wurde. Das Ziel ist klar: Jeder Mensch soll den Assistenten einfach und intuitiv bedienen können.
Das sind die grundlegenden Funktionen, die Gemini für jeden zugänglicher machen:
- Für Menschen mit motorischen Einschränkungen: Wer Schwierigkeiten hat, eine Tastatur zu bedienen, kann seine Anfragen (Prompts) einfach sprechen.
- Für Menschen mit sprachlichen Einschränkungen: Wer nach einem Schlaganfall oder aufgrund einer Spastik nicht immer klar sprechen kann, hat jederzeit die Möglichkeit, alle Prompts einfach zu tippen.
- Maximale Flexibilität: Sie können sogar nahtlos abwechseln! Sprechen Sie den ersten Prompt und tippen Sie den nächsten – ganz wie es für Sie in diesem Moment am besten passt.
- Bilder verstehen: Sie können Gemini ein Bild zeigen und dazu eine Frage stellen. Machen Sie zum Beispiel ein Foto von einer Pflanze und fragen Sie: „Was ist das für eine Pflanze und wie pflege ich sie?“
- Für blinde und gehörlose Menschen: Gemini antwortet immer auf zwei Wegen gleichzeitig: mit Text auf dem Bildschirm und per Sprachausgabe. So können blinde Menschen die Antwort hören und gehörlose Menschen sie lesen.
Gemini im Praxistest: Eine persönliche Erfahrung von Markus Lemcke
Wie sehr diese Funktionen den Alltag verbessern können, zeigt ein persönliches Beispiel. Ich, Markus Lemcke, kann aufgrund meiner Körperbehinderung (Spastik) ein Android-Gerät mit meinen Händen nur sehr schwer bedienen. Bisherige Lösungen wie „Voice Access“ waren eine Hilfe, aber da mein Sprechen nicht immer perfekt ist, wurde ich oft nicht richtig verstanden.
Genau hier setzt Gemini neue Maßstäbe. Es ermöglicht mir nicht nur, das Smartphone komplett per Sprache zu steuern, sondern bietet auch den entscheidenden Vorteil: Wenn mich die Spracherkennung einmal nicht versteht, kann ich den Befehl einfach schnell eintippen.
Folgende Befehle nutze ich täglich erfolgreich auf meinem Smartphone:
Apps und Funktionen steuern:
- „Hey Google, öffne die App Lichess, ich möchte Schach spielen.“
- „Ok Google, öffne WhatsApp.“
- „Ok Google, erstelle einen Screenshot.“
- „Hey Google, öffne meinen Kalender.“
- „Schalte die Taschenlampe ein.“ (und natürlich auch wieder aus)
Die Lautstärke präzise regeln:
- „Schalte das Handy stumm.“
- „Stelle die Lautstärke auf Maximum.“
- „Stelle die Klingeltonlautstärke auf 50 Prozent.“
- „Stelle die Medienlautstärke auf 70 Prozent.“
Informationen zugänglich machen – für alle
Für blinde Menschen kann es sehr anstrengend sein, sich lange Webseiten von einem Screenreader vorlesen zu lassen. Menschen, die nach einem Schlaganfall nicht mehr lesen können, stehen vor einer ähnlichen Hürde. Für beide Personengruppen ist diese Funktion von Gemini revolutionär:
„Fasse den Inhalt der Webseite www.marlem-software.de zusammen.“
Mit diesem einfachen Prompt liest Gemini die Webseite und gibt eine kurze, verständliche Zusammenfassung aus – sowohl als Text als auch per Sprache.
Ein besonderer Moment: Fotografie wird endlich möglich
Zum Schluss möchte ich noch auf ein Thema eingehen, das mir persönlich sehr am Herzen liegt: das Fotografieren. Meine rechte Hand ist so stark eingeschränkt, dass ich keinen Auslöser an einem normalen Fotoapparat drücken kann. Kameras für Linkshänder sind praktisch nicht zu finden.
Erst seit es Smartphones gibt, kann ich überhaupt Fotos machen. Und jetzt, mit Gemini, ist es noch einfacher geworden. Ich brauche keine spezielle App mehr, sondern sage einfach:
„Mach ein Foto.“
Das ist für mich genial und ein perfektes Beispiel dafür, wie Technologie Barrieren einreißen kann.
Der Sprung nach vorn: Was Gemini wirklich anders macht
Bisher kannten wir den Google Assistant als einen zuverlässigen digitalen Butler. Er war fantastisch darin, klare Befehle auszuführen: „Stelle einen Timer“, „Spiele meine Lieblingsplaylist“ oder „Wie wird das Wetter?“.
Gemini ist mehr als das. Stellen Sie sich Gemini nicht als Butler vor, sondern als Ihren persönlichen Assistenten und kreativen Partner. Er kann nicht nur Aufgaben erledigen, sondern auch komplexe Zusammenhänge verstehen, mitdenken, planen und sogar völlig neue Ideen entwickeln.
Ein Gespräch statt einzelner Befehle
Ein entscheidender Unterschied liegt in der Art des Dialogs. Gemini kann sich an den Kontext eines Gesprächs erinnern, was die Interaktion viel natürlicher macht.
Ein einfaches Beispiel aus dem Alltag:
- Mit dem alten Google Assistant:
- Sie: „Fußball-Bundesliga: Wann ist die nächste Runde?“
- Neue Frage: Sie mussten den Kontext wiederholen: „Fußball-Bundesliga: Gegen wen spielt Bayern München in der nächsten Runde?“
- Mit dem neuen Gemini:
- Sie: „Fußball-Bundesliga: Wann ist die nächste Runde?“
- Neue Frage: Sie können natürlich nachfragen: „Und gegen wen spielt Bayern München?“
Gemini weiß, dass Sie immer noch über die Bundesliga sprechen, und Sie müssen sich nicht ständig wiederholen. Das Gespräch fühlt sich flüssiger und menschlicher an.
Sehen und Verstehen: Die Welt mit der Kamera erfassen
Die vielleicht größte Neuerung ist die visuelle Interaktion. Sie können Gemini einfach ein Foto zeigen oder Ihre Kamera auf etwas richten und eine Frage dazu stellen.
- In der Küche: Sie öffnen den Kühlschrank, machen ein Foto vom Inhalt und fragen: „Was kann ich mit diesen Zutaten zum Abendessen kochen? Gib mir ein einfaches Rezept.“
- Bei der Fehlersuche: Eine Warnlampe in Ihrem Auto leuchtet auf. Sie machen ein Foto davon und fragen: „Was bedeutet dieses Symbol und wie dringend ist es?“
Zeit sparen: Informationen auf den Punkt gebracht
Hier zeigt sich die wahre Stärke von Gemini bei der Verarbeitung von Informationen. Statt nur oberflächliche Fakten zu liefern, kann Gemini tiefgehende Analysen und Vergleiche erstellen, die genau auf Ihre Fragen zugeschnitten sind.
Beispiel 1: Technologie für Anfänger erklären
Für jemanden, der in ein neues Thema einsteigen möchte, kann Gemini komplexe Informationen verständlich aufbereiten.
Prompt:
Vergleiche die Programmiersprachen Java und Python für einen Anfänger.
- Der Unterschied: Gemini gibt nicht nur eine Liste von Fakten aus, sondern erstellt einen Vergleich, der speziell auf die Bedürfnisse und das Wissenslevel eines Anfängers zugeschnitten ist – inklusive Empfehlungen für den Einstieg.
Beispiel 2: Detaillierte Expertenanalyse für Barrierefreiheit
Noch beeindruckender wird es, wenn die Anfragen sehr spezifisch werden. Für Nutzer von assistiver Technologie ist ein detaillierter Vergleich entscheidend.
Prompt:
Vergleiche die Screenreader TalkBack für Android und VoiceOver für iOS in einer Tabelle. Gehe dabei besonders auf die Gestensteuerung, die Qualität und Auswahl der Sprachausgabe, die Integration ins Betriebssystem und die Anpassungsmöglichkeiten für den Nutzer ein.
- Der Unterschied: Dies ist eine Expertenanfrage. Gemini erstellt eine strukturierte, detaillierte Gegenüberstellung in Tabellenform, die genau die geforderten Kriterien berücksichtigt. Das ist eine Analyse, die man sich sonst mühsam aus vielen verschiedenen Quellen zusammensuchen müsste.
Ihr kreativer Partner: Ideen finden und Pläne schmieden
Hier kann Gemini als Ihr kreativer Sparringspartner agieren.
- Für Geschenkideen: „Gib mir 5 kreative Geschenkideen für meinen Vater zum Geburtstag. Er mag Gartenarbeit, Krimis und italienisches Essen. Das Budget liegt bei ca. 50 Euro.“
- Für die Freizeitgestaltung: „Plane einen kinderfreundlichen Tagesausflug in der Nähe von München für einen Samstag. Es soll eine Mischung aus Natur und etwas zum Lernen sein.“
Der Unterschied auf einen Blick
Fähigkeit | Alter Google Assistant | Neuer Gemini |
---|---|---|
Verständnis | Erkannte Schlüsselwörter und Befehle. | Versteht komplexen Kontext, Nuancen und Bilder. |
Antwort | Gab eine direkte Antwort von einer Quelle. | Synthetisiert Infos aus vielen Quellen zu einer neuen Antwort. |
Interaktion | Befehl ? Ausführung. Jede Frage war neu und brauchte den vollen Kontext. | Führt ein echtes Gespräch. Erinnert sich an den Kontext, sodass Folgefragen natürlich gestellt werden können. |
Fokus | Aufgaben erledigen (Tasks). | Probleme lösen und Inhalte erstellen (Solutions & Creation). |
Kurz gesagt: Während der Google Assistant Ihr digitaler Butler war, ist Gemini Ihr persönlicher Assistent und kreativer Partner, der mitdenkt und Ihnen komplexe Denk- und Planungsarbeit abnimmt.
Schlussbemerkung: Mehr als nur KI – Ein Werkzeug für echte Teilhabe
Die Reise vom Google Assistant zu Gemini ist weit mehr als nur ein technisches Upgrade oder ein neuer Name. Wie die Beispiele zeigen, erleben wir einen fundamentalen Wandel: weg vom reinen Befehlsempfänger, hin zu einem intelligenten Partner, der mitdenkt, versteht und kreativ unterstützt.
Doch die wahre Revolution von Gemini liegt für mich nicht allein in seiner künstlichen Intelligenz, sondern darin, wie diese Intelligenz eingesetzt wird, um Barrieren abzubauen. Die Fähigkeit, komplexe Fragen zu beantworten, Inhalte zusammenzufassen oder visuelle Informationen zu verarbeiten, ist nicht nur ein technisches Gimmick. Für viele Menschen bedeutet sie einen direkten Zuwachs an Selbstständigkeit und Teilhabe am digitalen Leben.
Ob es die Möglichkeit ist, endlich selbstbestimmt ein Foto zu machen, sich komplexe Vergleiche für die Nutzung assistiver Technologien erstellen zu lassen oder einfach nur ein flüssigeres Gespräch mit seinem Gerät zu führen – hier zeigt sich, was Technologie im besten Fall sein kann: ein Werkzeug, das den Menschen in den Mittelpunkt stellt.
Für mich, Markus Lemcke, ist dieser Fortschritt ein klares Signal. Die Zukunft digitaler Assistenten ist nicht nur intelligenter und leistungsfähiger, sondern vor allem auch inklusiver. Und mit Gemini hat diese Zukunft bereits begonnen.
Wenn Sie Fragen zu den obigen Themen haben, schreiben Sie mir eine Mail an info@marlem-software.de oder rufen Sie mich an unter 07072/1278463 .
Weiterlesen
Praxistest ChatGPT: Wie barrierefrei ist die künstliche Intelligenz ChatGPT im Betriebssystem Windows 11?
Praxistest Google AI: Googles KI: Google AI Studio und Barrierefreiheit
Barrierefreiheit und Künstliche Intelligenz: Der komplette Leitfaden (nach EN 301 549 + WCAG 2.2)
Ein Gedanke zu „Gemini: Aus dem Google Assistent wird ein barrierefreier Sprachassistent mit Künstlicher Intelligenz“