In den vergangenen Monaten haben Unternehmen wie @ perplexity_ai, @ browsercompany und jüngst auch @ OpenAI eigene agentische Browser auf den Markt gebracht.
Für diese Unternehmen ist es ein logischer Schritt, die Browser-Ebene zu kontrollieren, da sie damit das gesamte Betriebssystem und die Nutzererfahrung steuern.
Die in diesen Browsern möglichen Aktionen konzentrieren sich meist auf die Leseebene – also das Lesen, Erklären und Zusammenfassen der angezeigten Inhalte. Browser wie Comet ermöglichen es, Browser-Agenten zu starten, die im Auftrag des Nutzers (Schreib-)Aktionen ausführen.

@ perplexity_ai Comet mit Reddit
Wenn Sie aktuell möchten, dass Ihr agentischer Browser für Sie handelt, sieht der Prozess so aus:

Der oben skizzierte Ablauf dauert etwa 10 Sekunden, wobei davon nur rund 2 Sekunden für die Abwicklung des Swaps on-chain benötigt werden.
Der Browser-Agent erstellt fortlaufend Screenshots der aktuellen Ansicht, verarbeitet diese und führt anschließend Aktionen über das DOM aus. Je komplexer die Benutzeroberfläche der Anwendung ist, desto langsamer wird dieser Prozess.
Gerade im Kryptobereich, in dem jede Millisekunde zählt, möchten Sie, dass Ihr Agent so schnell wie physikalisch möglich agiert. Stellen Sie sich vor, Sie können einen Token nicht rechtzeitig kaufen, weil Ihr Agent (hier der Browser) gerade versucht, eine Oberfläche wie das Bloomberg Terminal zu verstehen.

Ansicht der McD-Statistiken im Jahr 2016
Jedes LLM hätte Schwierigkeiten, sich in der oben gezeigten Oberfläche zurechtzufinden – und viele Protokolle und Apps im Kryptobereich verfügen über schlechte Interfaces.
Agentische Browser können den wichtigsten Vorteil von Krypto nicht nutzen: die öffentliche Verfügbarkeit von Daten und Protokollen.
Jeder Agent, der mit Krypto interagiert,
Jeder Nutzer sollte das grundlegende Recht haben, Systeme zu nutzen, die es ermöglichen, komplexe Finanzaufgaben zu erstellen und auszuführen – ohne Skripte zu schreiben, zu programmieren oder eigene Infrastruktur zu betreiben, sondern einfach durch Prompts in einfachem Englisch.
Ein guter Prompt ist mehr wert als tausend Zeilen Code.
Bei SendAI setzen wir uns dafür ein, dieses Grundrecht jedem Nutzer bereitzustellen.





