Gemini API krok po kroku

Google Gemini API

Gemini to LLM rozwijany przez Google, który zyskuje na popularności dzięki swojej wszechstronności i łatwej integracji z różnymi aplikacjami. W wielu krajach stał się domyślnym modelem do testów ze względu na codzienne darmowe tokeny do wykorzystania przez API, jednak na terenie Europejskiego Obszaru Gospodarczego musimy za to płacić w pełni. W niniejszym poradniku pokazuję, jak krok po kroku połączyć się z API Gemini i wygenerować automatycznie większą ilość treści.

Jak uzyskać klucz API do Gemini?

Pierwszym krokiem do połączenia się z Gemini API jest uzyskanie klucza. Ze względu na połączenie z innymi usługami Google'a i podstawowym kontem, ten element jest niezwykle prosty.

Aby uzyskać klucz API do Gemini, należy:

  1. Zalogować się do Google AI Studio.
  2. W lewym górnym rogu kliknąć przycisk "Get API key".
  3. Kliknąć przycisk "Create API key".
  4. Wybrać projekt z Google Cloud (jeżeli nie mieliście jeszcze do czynienia z tą usługą, pomogą trzy pierwsze punkty z mojego poradnika Google Cloud).
  5. Kliknąć "Create API key in existing project".
  6. Skopiować klucz API w bezpieczne miejsce.

Prosty skrypt do łączenia się z Gemini API

Kiedy mamy już klucz API z Google AI Studio, możemy przejść do generowania treści. Standardowo dla moich poradników skorzystamy z Pythona. Przykładowy skrypt połączy się z arkuszem Google Sheets (pobieranie uwierzytelniającego pliku JSON prezentuję w swoim poradniku Google Sheets API), wykreuje treść na bazie wskazanych tam wytycznych, po czym umieści ją w tym samym arkuszu.

Aby wygenerować treści w Gemini przez API na bazie wskazanych konspektów, należy:

  1. Przygotować arkusz Google Spreadsheets z konspektami w formie promptów.

    Prompty do generowania treści w AI
  2. Otworzyć skrypt do łączenia się z API Gemini w Google Colab i skopiować go na własny Dysk Google.
  3. Odpalić kod instalujący moduł "google-generativeai".
  4. Wczytać do pamięci wirtualnej uwierzytelniający plik JSON.
  5. Uzupełnić w kodzie nazwę swojego pliku JSON.
  6. Uzupełnić w kodzie adres URL do arkusza Google Sheets.
  7. Uzupełnić w kodzie wybrany model (aktualna lista dostępnych znajduje się tutaj).
  8. Uzupełnić w kodzie klucz API z Google AI Studio.
  9. Uzupełnić w kodzie nazwy kolumn do przetworzenia.

    Prosty skrypt do API Google Gemini
  10. Odpalić kod i poczekać na wygenerowanie treści.

Standardowo warto odpalić taki kod najpierw na 2-3 promptach, a gdy będzie działał git na mniejszej liczbie, wówczas wygenerować całość.

Google Gemini — koszt

Dokładny koszt generowania treści dla różnych modeli Google Gemini podany jest w tabeli na stronie usługodawcy, ale przytaczanie go w tym miejscu nie ma sensu z dwóch powodów. Po pierwsze, wraz z premierami kolejnych modeli ceny się zmieniają. Po drugie, wielu osobom kwoty za tysiąc lub milion tokenów nie mówią zbyt wiele. Jako że sam również mam problem z wizualizowaniem sobie podobnych kosztów, przedstawię w tym miejscu koszt wygenerowania określonej liczby treści.

Jak to zazwyczaj bywa w przypadku usług Google'a tego typu, zasady naliczania kosztów nie mogą być proste. Gemini API w żaden sposób nie podaje liczby wykorzystywanych tokenów, czy to wejściowych, czy generowanych. Z tego samego względu w chwili publikacji tego artykułu nie mogę podać dokładnych kosztów — ich wyszczególnienie pojawić może się nawet po 24h od wygenerowania treści.

Tworząc niniejszy poradnik, wygenerowałem 73 teksty liczące średnio 2754 zzs (bez tytułu oraz nagłówków). Mimo pierwotnych oporów związanych z niejasnym modelem rozliczeń skorzystałem ostatecznie z modelu Gemini 1.5 Pro w wersji "gemini-1.5-pro-latest". Cyferki prezentują się następująco:

WskaźnikCyferki
Input Tokensbrak danych
Output Tokensbrak danych
Znaki ze spacjami201 038
Zzs na 1 tekst (średnia)2754
Czas31 minut
Koszt2,49 zł

Jakość artykułów możecie ocenić sami, gdyż pełne wyniki dla 73 tekstów dostępne są w tym arkuszu. Szerszy opis z mojej perspektywy zamieszczę przy zbiorczym porównaniu tekstów generowanych w trakcie pisania bliźniaczych poradników: