Ollama merupakan aplikasi yang memungkinkan kamu menjalankan Large Language Model (LLM) secara lokal tanpa bergantung pada layanan AI berbasis cloud seperti OpenAI atau Gemini.
Dengan Ollama, kamu bisa mencoba berbagai model AI open source seperti Llama, DeepSeek, Qwen, Gemma, dan lainnya langsung dari VPS.
Pada tutorial ini, kita akan membahas cara install Ollama di VPS Linux, menjalankan model AI pertama, hingga mengaktifkan akses API agar dapat digunakan dari aplikasi lain.
Tutorial ini diuji menggunakan VPS Debian 13 dengan spesifikasi berikut ini
VPS yang digunakan merupakan VPS dari Vultr. Jika kamu belum memiliki VPS, kamu bisa mendaftar akun di vultr.com dan berkesempatan mendapatkan $300 credit trial selama 30 hari.
Jika sudah memiliki VPS atau ingin dicoba di local langsung, maka kamu bisa langsung memulai langkah-langkah Cara Install Ollama di VPS Linux dan Menjalankan AI Lokal berikut ini.
Sebelum menginstall Ollama, sebaiknya lakukan update paket di VPS.
sudo apt update && sudo apt upgrade -yInstall Ollama menggunakan script resmi dari Ollama
curl -fsSL https://ollama.com/install.sh | shSelanjutnya, pastikan Ollama sudah berjalan di VPS
systemctl status ollamaJika sudah berjalan, maka status service akan menampilkan keterangan active (running).
Sebagai contoh, kita akan menggunakan model Llama 3.2 1B yang relatif ringan sehingga cocok digunakan untuk VPS dengan RAM 2 GB. Untuk model lain, kamu bisa memeriksanya dari halaman Models di Ollama.
ollama run llama3.2:1bSaat pertama kali dijalankan, Ollama akan mendownload model yang akan kamu gunakan. Tunggu hingga proses download selesai dan setelahnya kamu bisa langsung mencoba memberikan prompt, misalnya:
Jelaskan apa itu WordPress dalam satu kalimat.Setelah selesai mencoba, kamu bisa menutup sesi dengan cara mengirimkan pesan /bye atau dengan klik tombol CTRL + D.
Secara default, API Ollama hanya dapat diakses dari localhost, atau di VPS saja. Jika kamu ingin mengakses API dari komputer lain atau aplikasi eksternal, ubah konfigurasi service Ollama.
sudo systemctl edit ollamaDidalam file editor, tambahkan baris berikut
[Service]Environment="OLLAMA_HOST=0.0.0.0:11434"Simpan file, kemudian jalankan kembali service.
sudo systemctl daemon-reloadsudo systemctl restart ollamaPastikan Ollama telah mendengarkan pada seluruh network interface.
ss -tulpn | grep 11434Apabila berhasil, hasilnya akan menampilkan alamat *:11434.
Konfigurasi ini membuat API Ollama dapat diakses melalui jaringan. Apabila server digunakan di lingkungan produksi, sebaiknya batasi akses menggunakan firewall atau reverse proxy agar tidak dapat diakses oleh sembarang orang.
Jika VPS menggunakan UFW, pastikan untuk mengizinkan akses ke port 11434.
sudo ufw allow 11434/tcpJika hanya ingin mengizinkan IP tertentu, gunakan perintah berikut:
sudo ufw allow from IP_ADDRESS to any port 11434 proto tcpGanti IP_ADDRESS dengan alamat IP yang diperbolehkan mengakses API Ollama.
Sekarang coba akses API menggunakan komputer lain. Misalnya kamu install Ollama di VPS, kamu bisa menjalankan perintah ini di local PC kamu:
curl http://IP_VPS:11434/api/generate -d '{ "model": "llama3.2:1b", "prompt": "Jelaskan apa itu WordPress dalam satu kalimat.", "stream": false }'Apabila berhasil, API akan mengembalikan data dalam format JSON, misalnya seperti ini
Itulah langkah-langkah yang bisa kamu coba untuk install Ollama di VPS linux dan menajalankan AI lokal.
Berdasarkan pengujian yang dilakukan pada VPS 2 vCPU dan RAM 2 GB, model AI berukuran kecil masih dapat berjalan dengan cukup baik. Model yang berhasil berjalan dengan lancar:
llama3.2:1bdeepseek-coder:1.3bSementara model yang lebih besar mulai mengalami penurunan performa.
qwen3.5:2b masih dapat dijalankan, namun respons yang sangat lambat.qwen3:4b sudah memenuhi RAM dan swap sehingga tidak layak digunakan.deepseek-r1:7b sangat lambat atau bahkan tidak merespon dan sangat tidak layak digunakan.Jika kamu juga menggunakan VPS dengan RAM 2 GB, sebaiknya gunakan model berukuran sekitar 1B hingga 1.5B atau model dengan ukuran file di bawah 2 GB agar tetap responsif.
Ollama merupakan solusi yang sangat praktis jika kamu ingin menjalankan AI secara lokal di VPS maupun server pribadi. Proses instalasinya relatif sederhana, dan kamu bisa langsung mencoba berbagai model AI hanya dengan beberapa perintah.
Meskipun demikian, pemilihan model tetap perlu disesuaikan dengan spesifikasi VPS yang digunakan. Untuk VPS dengan RAM 2 GB, model ringan seperti Llama 3.2 1B atau DeepSeek Coder 1.3B menjadi pilihan yang lebih ideal dibandingkan model berukuran besar.
Bisa. Berdasarkan pengujian pada tutorial ini, Ollama dapat berjalan dengan baik pada VPS 2 GB RAM menggunakan model AI berukuran kecil seperti Llama 3.2 1B dan DeepSeek Coder 1.3B.
Saat pertama kali digunakan, Ollama perlu memuat model dari penyimpanan ke RAM. Setelah model berhasil dimuat, request berikutnya biasanya akan diproses lebih cepat selama model tersebut masih berada di memori.
Gunakan perintah berikut.
ollama listUntuk menghapus model Ollama yang sudah didownload, kamu bisa menggunakan perintah ollama rm NAMA_MODEL. Misalnya
ollama rm llama3.2:1bBisa. Ollama menyediakan REST API yang dapat diakses melalui port 11434 sehingga dapat digunakan oleh berbagai aplikasi, termasuk editor kode, workflow automation, maupun plugin WordPress yang mendukung OpenAI Compatible API seperti plugin Koneek.
KOMENTAR
Memuat...