Limity a guard pravidlá
Nastavte per-org, per-user a per-endpoint limity pre requesty, tokeny alebo odhad nákladov. Podpora soft aj hard limitov.
AI Cost Guard Pro je ľahká vrstva nad AI API pre tímy a aplikácie. Nastavíte limity (org/user/endpoint), presmerujete requesty na vhodné modely a získate prehľadný audit každého volania — bez chaosu v rozpočte.
# limity
org.daily_eur = 25
user.daily_eur = 5
# routing
if task == "summarize": model = "cheap"
if task == "code": model = "strong"
# alert
when org.daily_eur > 0.8 * limit: notify("slack")
Jednoduché pravidlá. Jasné náklady. Vždy viete, kto a prečo míňa.
Postavené pre tímové použitie: viac projektov, viac modelov, jedna kontrolná vrstva.
Nastavte per-org, per-user a per-endpoint limity pre requesty, tokeny alebo odhad nákladov. Podpora soft aj hard limitov.
Presmerujte úlohy na vhodné modely podľa pravidiel (napr. „lacno“ pre rutinu, „výkon“ pre kritické úlohy). Konzistentne a auditovateľne.
Každý request je logovaný s modelom, odhadom ceny a vlastníkom (projekt/user). Reporty pomáhajú vysvetliť náklady stakeholderom.
Upozornenia pri blížiacom sa limite (email, webhook; podľa nasadenia aj Slack/Teams). Nečakajte na koniec mesiaca.
Zastavte testy alebo dávkové joby, ktoré by prekročili budget. Menej „nočných“ výdavkov bez dohľadu.
Minimalizmus: nastavíte endpoint, tokeny a základné policy šablóny. Všetko ostatné dolaďujete postupne podľa dát.
Štyri kroky od „nemáme kontrolu“ po „máme budget pod dohľadom“.
V praxi tímy často kombinujú viac modelov a API. Pomôžeme vám nastaviť jednotný pohľad na náklady naprieč integráciami.
Napísať námOrientačné balíky. Pre väčšie tímy pripravíme plán na mieru.
0 €
19 €/mes
Dohodou
Najčastejšie otázky pred pilotom.
Záleží od režimu. V typickom nastavení pracujeme s metadátami requestov a metrikami. Pre citlivé prostredia vieme nastaviť minimalizované logovanie a retenčné pravidlá.
Áno — hard limit vie requesty zastaviť alebo presmerovať na lacnejší model. Soft limit vás upozorní a nechá priestor na kontrolovaný „overage“.
Nie. Viete spravovať náklady naprieč viacerými modelmi a integráciami. Pri deme si zladíme váš konkrétny stack.
Napíšte nám pár viet (koľko používateľov, aké modely, aký rozpočet) a ozveme sa s návrhom nastavenia.