在开始之前,请确保您的系统满足以下要求: - 已安装Docker(版本20.10.0或更高) - 具有足够的硬件资源(建议至少4GB RAM) - 操作系统支持(Linux/macOS/Windows)
docker pull ollama/ollama
基本运行命令:
docker run -d --name ollama -p 11434:11434 ollama/ollama
推荐的生产环境配置(包含数据持久化和GPU支持):
docker run -d \
--name ollama \
--gpus all \
-v ollama_data:/root/.ollama \
-p 11434:11434 \
ollama/ollama
检查容器是否正常运行:
docker ps
查看日志:
docker logs ollama
为了确保模型数据在容器重启后不丢失,建议挂载数据卷:
docker run -d \
--name ollama \
-v ollama_data:/root/.ollama \
-p 11434:11434 \
ollama/ollama
如果您的系统有NVIDIA GPU,可以启用GPU加速:
docker run -d \
--name ollama \
--gpus all \
-v ollama_data:/root/.ollama \
-p 11434:11434 \
ollama/ollama
可以通过环境变量配置Ollama:
docker run -d \
--name ollama \
-e OLLAMA_HOST=0.0.0.0 \
-e OLLAMA_MODELS=/path/to/models \
-v ollama_data:/root/.ollama \
-p 11434:11434 \
ollama/ollama
docker exec ollama ollama pull llama2
docker exec ollama ollama run llama2
Ollama提供REST API,可以通过以下方式访问:
curl http://localhost:11434/api/generate -d '{
"model": "llama2",
"prompt":"Why is the sky blue?"
}'
如果11434端口已被占用,可以修改映射端口:
docker run -d --name ollama -p 11435:11434 ollama/ollama
如果遇到权限错误,可以尝试:
docker run -d --name ollama -p 11434:11434 --user $(id -u):$(id -g) -v ollama_data:/root/.ollama ollama/ollama
对于大型模型,可能需要增加Docker内存限制:
- 在Docker Desktop设置中调整资源限制
- 或使用--memory
参数:
docker run -d --name ollama -p 11434:11434 --memory 8g ollama/ollama
docker pull ollama/ollama
docker stop ollama
docker rm ollama
# 然后使用之前的run命令重新创建容器
docker run --rm --volumes-from ollama -v $(pwd):/backup busybox tar cvf /backup/ollama_backup.tar /root/.ollama
docker run --rm --volumes-from ollama -v $(pwd):/backup busybox tar xvf /backup/ollama_backup.tar
通过以上步骤,您应该已经成功在Docker环境中安装并配置了Ollama。根据您的具体需求,可以调整配置参数以获得最佳性能。