Entdeckung in Android: Gemini KI direkt aus Google-Suche aktivierbar

April 8, 2024

In den Tiefen der Android-Betriebssystemdateien wurde kürzlich eine Einstellung entdeckt, die es ermöglicht, die künstliche Intelligenz Gemini direkt aus der Google-Suche zu aktivieren – eine Funktionalität, die an das Betriebssystem iOS erinnert. Diese Entdeckung wirft Fragen nach dem Zweck dieser Integration auf und ob sie möglicherweise mit einem allgemeinen Rollout von KI im Suchbereich zusammenhängt, der für Mai 2024 gemunkelt wird. Gemini stellt Googles bisher leistungsfähigstes KI-Modell dar, das mit fortschrittlichen Trainingsmethoden, Technologien und Funktionen ausgestattet ist, die weit über die Fähigkeiten existierender Modelle hinausgehen. Als erstes KI-Modell, das nativ für die Arbeit mit multimodalen Daten trainiert wurde, kann Gemini Bilder, Text, Video und Audio verarbeiten und Wissen aus diesen verschiedenen Medienformen ziehen. Frühere KI-Modelle mussten für Multimodalität mit separaten Komponenten trainiert und anschließend zusammengeführt werden, was laut Google für komplexe Denkaufgaben nicht optimal funktionierte. Gemini hingegen ist von Grund auf multimodal trainiert, was ihm eine überlegene Komplexität im Reasoning ermöglicht. Ein weiteres Merkmal von Gemini ist die beispiellose Größe des Kontextfensters – also der Menge an Daten, die ein Sprachmodell gleichzeitig berücksichtigen kann, um eine Entscheidung zu treffen. Kontextfenster werden in "Tokens" gemessen, die die kleinste Informationseinheit darstellen. Gemini 1.5 Pro hat ein Kontextfenster von einer Million Tokens, was bedeutet, dass es den vollständigen Text der "Herr der Ringe"-Trilogie oder zehn Stunden Video verarbeiten und Fragen dazu beantworten kann. Zum Vergleich: Das größte Kontextfenster von OpenAI beträgt 128.000 Tokens und könnte beispielsweise den 198-seitigen Roman "Robinson Crusoe" oder etwa 1.600 Tweets berücksichtigen. Interne Forschungen bei Google zeigen, dass ihre fortschrittlichen Technologien Kontextfenster von bis zu 10 Millionen Tokens ermöglichen könnten. Die geleakte Funktionalität ähnelt der iOS-Implementierung, in der die Gemini-KI direkt über die Suchleiste in der Google-App auf Apple-Mobilgeräten zugänglich ist. Die offiziellen Anweisungen für iOS spiegeln die Funktionalität wider, die der Forscher in Android versteckt gefunden hat. Demnach könnten Nutzer auf iPhones mit Gemini im Google-App chatten, um auf neue Weise zu lernen, Bilder zu erstellen und Unterstützung zu erhalten – interagierend durch Text, Sprache, Bilder und die Kamera. Für die Aktivierung dieser Funktion ist es notwendig, ein Android-Telefon zu rooten, was bedeutet, dass man auf die Betriebssystemdateien auf der fundamentalsten Ebene zugreift. Laut der Person, die die Informationen durchsickern ließ, ist eine der Voraussetzungen für den Umschalter, dass Gemini bereits als mobiler Assistent aktiviert sein sollte. Außerdem muss eine App namens GMS Flags installiert sein, um die Fähigkeit zu erlangen, Google-App-Funktionen ein- und auszuschalten. Es gibt Gerüchte, dass Google die offizielle Einführung der Google Search Generative Experience (SGE) auf der I/O-Konferenz im Mai 2024 ankündigen könnte. Diese Informationen stammen nicht von der PR-Abteilung von Google, sondern entsprechen dem intern geplanten Startdatum. Natürlich könnte sich dieser Zeitplan noch ändern, da er noch einige Wochen in der Zukunft liegt. Im letzten Jahr wurden mehrere Starttermine verpasst. Die geleakte Umschaltfunktion könnte ein Hinweis darauf sein, wie Google möglicherweise eine KI-basierte Frontend-Suche ausrollen könnte, und ob dieser Umschalter in irgendeiner Weise mit dieser Funktion verbunden ist. Gemini steht derzeit in der Google-App für iOS zur Verfügung, und es sieht so aus, als würde diese Funktionalität bald auch Android erreichen. Dies würde eine nahtlose Integration von KI-Diensten in das mobile Betriebssystem von Google bedeuten und könnte die Art und Weise, wie wir suchen und interagieren, grundlegend verändern. Mit der Fähigkeit, komplexe Aufgaben in Echtzeit zu bearbeiten und multimodale Daten zu verarbeiten, stellt Gemini einen bedeutenden Fortschritt in der Suchtechnologie dar. Es bleibt abzuwarten, wie sich die Implementierung von Gemini auf die SEO-Branche und die allgemeine Nutzung von Suchmaschinen auswirken wird. Doch eines ist sicher: Die Entwicklung der KI und ihre Integration in alltägliche Technologien schreitet unaufhaltsam voran und wirft gleichzeitig spannende Fragen über die Zukunft unserer Interaktion mit Maschinen und Informationen auf.