In diesem Artikel werden wir uns die Implementierung und Beispiele dafür ansehen, wie chatgpt mit Computer Vision funktioniert.

Ich entwickle meine ChatGPT-4-Telegramm Bot in Python. Ich kam auf die Idee, mithilfe von Computer Vision nach Text in einem Bild zu suchen und eine Abfrage in ChatGPT zu verfassen.

Implementierung

Tesserakt ist eine beliebte Open-Source-OCR-Engine, die für die Unterstützung von über 100 Sprachen vorab trainiert wurde. In diesem Artikel verwenden wir Python-tesseract (pytesseract), einen Python-Wrapper für Tesseract, der es Ihnen ermöglicht, Tesseract mit Python zu verwenden.

Bevor Sie Tesseract verwenden, müssen Sie Folgendes tun Installieren. Vergessen Sie nicht, die russische Sprache in den Installationsoptionen hinzuzufügen.

Beispiele

Alle Beispiele werden in meinem Telegram-Bot gezeigt, da es bequemer ist als über die Konsole, und natürlich aus Gründen der Werbung …

{ „osnovaUnitId“: null, „url“: „https://booster.osnova.io/a/relevant?site=vc&v=2“, „place“: „post_inside“, „site“: „vc“, „ Einstellungen“: {„Modi“:{„externalLink“:{„buttonLabels“:[„\u0423\u0437\u043d\u0430\u0442\u044c“,“\u0427\u0438\u0442\u0430\u0442\u044c“,“\u041d\u0430\u0447\u0430\u0442\u044c“,“\u0417\u0430\u043a\u0430\u0437\u0430\u0442\u044c“,“\u041a\u0443\u043f\u0438\u0442\u044c“,“\u041f\u043e\u043b\u0443\u0447\u0438\u0442\u044c“,“\u0421\u043a\u0430\u0447\u0430\u0442\u044c“,“\u041f\u0435\u0440\u0435\u0439\u0442\u0438″]}},“deviceList“:{„desktop“:\u0414\u0435\u0441\u043a\u0442\u043e\u043f,“smartphone“:\u0421\u043c\u0430\u0440\u0442\u0444\u043e\u043d \u044b“,“tablet“:“\u041f\u043b\u0430\u043d\u0448\u0435\u0442\u044b“}} }

Der Bot ist kostenlos. Hat eine tolle Funktionalität. Alle Informationen finden Sie darin.

Der Telegram-Bot kann ein Foto in zwei Modi verarbeiten:

  • Text aus einem Bild ohne Anfrage in ChatGPT abrufen. Schreiben Sie dazu den Befehl /text in die Bildunterschrift oder lassen Sie dieses Feld leer.
  • Textverarbeitung mit Anweisungen für ChatGPT. Die Anweisung (Anfrage) steht in der Bildunterschrift.

Versuchen wir, den Text auf diesem mit dem Telefon aufgenommenen Foto des Dokuments zu erkennen.

Es gibt Ungenauigkeiten, aber insgesamt nicht schlecht

Versuchen wir, eine Testaufgabe mit ChatGPT zu lösen.

Für mich stellte sich heraus, dass es durchaus anwendbar war. Könnte nützlich sein. Sie können alle Beispiele selbst ausprobieren Telegram-Bot.

Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein