ડિજીયો ઈન્ફ્રાસ્ટ્રક્ચર

AI મોડલ્સ અને GPU

આજે જ મેનેજ્ડ ફ્રન્ટિયર મૉડલ્સ પર એજન્ટો ચલાવો—અથવા GPU ક્ષમતા ભાડે આપો, તમારું પોતાનું વજન ગોઠવો અને ડિજીયો કાર્યોને એ જ વર્કસ્પેસમાં ખાનગી એન્ડપોઇન્ટ પર રૂટ કરો.

ક્લાઉડ, જીપીટી, જેમિની પ્રતિ-એજન્ટ મૉડલ પસંદ GPU ભાડા અને BYOM
સંચાલિત મોડેલો

ડિજીયોમાં આજે મોડલ્સ ઉપલબ્ધ છે

એજન્ટ દીઠ ડિફોલ્ટ મોડલ સોંપો અથવા કાર્ય દીઠ ઓવરરાઇડ કરો. તમારા પ્લાન બેલેન્સમાંથી ડિજીયો ટોકન્સમાં વપરાશનું માપન કરવામાં આવે છે—એજન્ટ સોનેટ, GPT-4o અથવા જેમિની ફ્લેશને કૉલ કરે તે જ વૉલેટ.

એન્થ્રોપિક ક્લાઉડ

  • Claude Opus 4.7 ફ્લેગશિપ તર્ક, લાંબા સંદર્ભ, આર્કિટેક્ચર અને વ્યૂહરચના કાર્ય.
  • Claude Opus 4.6 સ્થિર, ઉચ્ચ-ગુણવત્તાના વિશ્લેષણ માટે અગાઉની પેઢીનું ઓપસ.
  • Claude Sonnet 4.6 દૈનિક ડ્રાઈવર-કોડિંગ, લેખન અને મલ્ટિ-સ્ટેપ એજન્ટ લૂપ્સ.
  • Claude Sonnet 4.5 / 4 સપોર્ટેડ વર્કલોડ પર પ્રોમ્પ્ટ કેશીંગ સાથે ઝડપી સોનેટ ટાયર.
  • Claude Haiku 4.5 લો-લેટન્સી ડ્રાફ્ટ્સ, વર્ગીકરણ અને ઉચ્ચ-વોલ્યુમ સબટાસ્ક.

ઓપનએઆઈ

  • GPT-5.5 / GPT-5.4 / GPT-5.2 સામાન્ય અને એજન્ટિક વર્કલોડ માટે નવીનતમ GPT-5 કુટુંબ.
  • GPT-4.1 & GPT-4o ઉત્પાદન એજન્ટો માટે વિશ્વસનીય મલ્ટિમોડલ ચેટ અને સાધનનો ઉપયોગ.
  • GPT-4o mini સારાંશ અને ઓછા વજનના પગલાઓ માટે ખર્ચ-કાર્યક્ષમ રૂટીંગ.
  • o3 / o3-pro / o3-mini / o4-mini ગણિત, આયોજન અને ચકાસણી માટે તર્ક-કેન્દ્રિત મોડલ.
  • GPT-5.3 Codex & Codex mini કોડ જનરેશન, રિફેક્ટર્સ અને રેપો-અવેર એજન્ટ કુશળતા.

ગૂગલ જેમિની

  • Gemini 2.5 Pro લાંબા-સંદર્ભ સંશોધન અને માળખાગત નિષ્કર્ષણ.
  • Gemini 2.5 Flash સ્પર્ધાત્મક ટોકન દરો સાથે ઉચ્ચ થ્રુપુટ એજન્ટ પગલાં.
  • Gemini 2.0 Flash પાર્સિંગ, ટેગિંગ અને બેચ જોબ્સ માટે અલ્ટ્રા-ફાસ્ટ પાસ.

ઓપન અને નિષ્ણાત API

  • DeepSeek Chat & Reasoner ચેટ અને ચેઇન-ઓફ-થોટ સ્ટાઇલ કાર્યો માટે મજબૂત મૂલ્ય.
  • Mistral Large બહુભાષી એજન્ટ ટીમો માટે યુરોપિયન-હોસ્ટેડ વિકલ્પ.
  • Llama 3.3 70B API દ્વારા ઓપન-વેઇટ ક્લાસ મોડલ—ખાનગી GPU સાથે સારી રીતે જોડાય છે.
  • Grok 3 સમાચાર અને સામાજિક દેખરેખ એજન્ટો માટે રીઅલ-ટાઇમ લક્ષી મોડેલ.
  • Sonar Pro સંશોધન એજન્ટો માટે શોધ આધારિત જવાબો.
  • Command R+ RAG-ફ્રેંડલી એન્ટરપ્રાઇઝ ચેટ અને પુનઃપ્રાપ્તિ વર્કફ્લો.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

ઉપયોગ

એજન્ટ કેવી રીતે મોડેલ પસંદ કરે છે

સંયોજક કાર્ય પ્રકાર પર આધારિત સૉનેટ વિ ઓપસ વિરુદ્ધ સસ્તા ફ્લેશ મોડલની ભલામણ કરી શકે છે. પાવર યુઝર્સ એજન્ટની ભૂમિકા દીઠ ડિફોલ્ટ સેટ કરે છે - સોનેટ પર સંશોધન, ઓપસ પર અંતિમ સમીક્ષા, હાઈકુ અથવા જેમિની ફ્લેશ પર બલ્ક ટેગિંગ.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU ભાડા

GPU ભાડે લો અને તમારા પોતાના મૉડલ ચલાવો

ફાઇન-ટ્યુન, એર-ગેપ્ડ ચેકપોઇન્ટ અથવા અનુમાનિત અનુમાન કિંમતની જરૂર છે? તમારા ડિજીયો વર્કસ્પેસમાં સમર્પિત GPU ક્ષમતા ઉમેરો, તમને પસંદ હોય તે સર્વિંગ સ્ટેક ઇન્સ્ટોલ કરો અને તમારા ખાનગી એન્ડપોઇન્ટ પર પોઈન્ટ એજન્ટો.

સમર્પિત ઉદાહરણો

કલાકદીઠ અથવા માસિક GPU નોડ્સ (A100, H100, L40S વર્ગ) તમારા ભાડૂત સાથે જોડાયેલા—અન્ય ગ્રાહકોથી અલગ.

તમારું વજન

સેફટેન્સર્સ, GGUF અપલોડ કરો અથવા તમારી રજિસ્ટ્રીમાંથી ખેંચો; લામા, મિસ્ટ્રલ, ક્વેન અને કસ્ટમ ફાઈન ટ્યુન ચલાવો.

પ્રમાણભૂત સેવા

vLLM, TGI, Ollama, અથવા કન્ટેનર છબીઓ તમે જાળવી રાખો છો—Digio એજન્ટો OpenAI- સુસંગત આધાર URL ને કૉલ કરે છે.

એ જ ઓર્કેસ્ટ્રેશન

કરવા માટે, ટીમ ચેટ, કુશળતા અને સહયોગ અપરિવર્તિત-માત્ર અનુમાન બેકએન્ડ તમારું છે.

હાઇબ્રિડ રૂટીંગ

ખાનગી GPU ને સંવેદનશીલ પગલાં મોકલો અને એક વર્કફ્લોમાં જાહેર સંશોધન માટે ક્લાઉડ અથવા GPT નો ઉપયોગ કરો.

એન્ટરપ્રાઇઝ નિયંત્રણો

VPC પીઅરિંગ, સ્ટેટિક એગ્રેસ, ઑડિટ લૉગ્સ અને રેગ્યુલેટેડ ટીમો માટે મૉડલ મંજૂર સૂચિઓ.

તમારું પોતાનું મોડેલ લાવો

કસ્ટમ મોડેલ ઇન્સ્ટોલ કરો અને કનેક્ટ કરો

તમારા એન્ડપોઇન્ટને કૉલ કરતા એજન્ટો માટે શૂન્યથી લાક્ષણિક સેટઅપ:

  1. GPU અનામત રાખો

    VRAM, પ્રદેશ અને અપટાઇમ પસંદ કરો (બર્સ્ટ વિરુદ્ધ હંમેશા ચાલુ). દાખલા સાથે વહાણના વજન માટેનો સંગ્રહ અથવા તમારી બકેટને માઉન્ટ કરે છે.

  2. સ્ટેક જમાવો

    સર્વિંગ ઇમેજ અથવા SSH માં શરૂ કરો, CUDA ડ્રાઇવરો ઇન્સ્ટોલ કરો અને ચેકપોઇન્ટ લોડ કરો. આરોગ્ય તપાસો પુષ્ટિ કરે છે કે મોડેલ તૈયાર છે.

  3. અંતિમ બિંદુ નોંધણી કરો

    વર્કસ્પેસ સેટિંગ્સમાં આધાર URL, API કી અને મોડેલ આઈડી ઉમેરો. Digio લાઇવ થતાં પહેલાં લેટન્સી અને ટોકન ફોર્મેટને માન્ય કરે છે.

  4. એજન્ટોને સોંપો

    પસંદ કરેલ એજન્ટો માટે ડિફોલ્ટ તરીકે તમારા ખાનગી મોડેલને પસંદ કરો; વ્યવસ્થાપિત ક્લાઉડ/GPT મૉડલ સાથે-સાથે ઉપલબ્ધ રહે છે.

GPU ભાડાનું બિલ Digio પ્લાન સબ્સ્ક્રિપ્શન્સથી અલગથી વસૂલવામાં આવે છે. ક્ષમતા આયોજન, SLAs અને હાલના અનુમાન ક્લસ્ટરમાંથી સ્થળાંતર માટે અમારો સંપર્ક કરો.

B2B SaaS વેબસાઇટ UI લેબલ. કુદરતી gu માં અનુવાદ કરો: FAQ

મોડલ અને GPU પ્રશ્નો

Digio પર સંચાલિત APIs વિ સ્વ-હોસ્ટ કરેલ અનુમાન પસંદ કરવું.

શું હું બે વાર ચૂકવણી કરું છું—પ્લાન પ્લસ API?

તમારું Digio સબ્સ્ક્રિપ્શન ઇન્ફ્રાસ્ટ્રક્ચર, એજન્ટો અને Digio ટોકન્સનો સમાવેશ કરે છે. મેનેજ કરેલ મોડલ વપરાશ ડેબિટ કે જે વાસ્તવિક ઇનપુટ/આઉટપુટ ટોકન્સ દ્વારા ટોકન બેલેન્સ. GPU ભાડા એ તમે નિયંત્રિત કરો છો તે મશીનો માટે એક એડ-ઓન છે.

શું વિવિધ એજન્ટો વિવિધ મોડેલોનો ઉપયોગ કરી શકે છે?

હા—દરેક એજન્ટની પોતાની ડિફોલ્ટ હોઈ શકે છે. વૈશ્વિક ડિફોલ્ટને બદલ્યા વિના કાર્યો અને ચેટ્સ એક રન માટે ઓવરરાઇડ કરી શકે છે.

સોનેટ અને ઓપસ વચ્ચે શું તફાવત છે?

ઓપસ સખત તર્ક અને લાંબા સમય સુધી સુસંગત યોજનાઓ માટે ટ્યુન છે; રોજિંદા એજન્ટ લૂપ્સ માટે સોનેટ ઝડપી અને સસ્તું છે. હાઈકુ અને ફ્લેશ-ક્લાસ મોડલ વોલ્યુમ સબટાસ્ક માટે શ્રેષ્ઠ છે.

શું હું ફક્ત મારું પોતાનું મોડેલ ચલાવી શકું અને ક્લાઉડ API ને અવરોધિત કરી શકું?

એન્ટરપ્રાઇઝ વર્કસ્પેસ આઉટબાઉન્ડ મોડલ પ્રદાતાઓને પ્રતિબંધિત કરી શકે છે અને તમામ એજન્ટ ટ્રાફિકને તમારા GPU એન્ડપોઇન્ટ પર રૂટ કરી શકે છે. હાઇબ્રિડ મોડ મોટાભાગની ટીમો માટે ડિફોલ્ટ છે.

કયા GPU કદ ઉપલબ્ધ છે?

ઑફરિંગ પ્રદેશ અને માંગ પર આધાર રાખે છે-સામાન્ય રીતે 7B–70B ક્લાસ મૉડલ્સ માટે 24-80 GB VRAM ટાયર અને મોટા સ્ટેક્સ માટે મલ્ટિ-GPU નોડ્સ. અમે તમારા પરિમાણની ગણતરી અને પરિમાણથી કદ VRAM ને મદદ કરીએ છીએ.

શું ખાનગી GPU ઉપયોગ હજુ પણ Digio Tokens નો ઉપયોગ કરે છે?

ઓર્કેસ્ટ્રેશન (એજન્ટ્સ, કાર્યો, સ્ટોરેજ) તમારી યોજના પર રહે છે. તમારા GPU પર અનુમાન GPU સમય તરીકે બિલ કરવામાં આવે છે; આંતરિક ચાર્જબેક માટે તમે વૈકલ્પિક રીતે ટોકન આકારના વપરાશને મીટર કરી શકો છો.

સંચાલિત મોડલ પસંદ કરો અથવા તમારું GPU લાવો

આજે જ ક્લાઉડ અને GPT પર પ્રારંભ કરો, પછી જ્યારે તમે કસ્ટમ વજન - સમાન એજન્ટો, સમાન કાર્યો, તમારા અનુમાનને હોસ્ટ કરવા માટે તૈયાર હોવ ત્યારે સમર્પિત GPU ઉમેરો.