Comment déployer Phi-3.5 Mini avec vLLM sur un serveur DigitalOcean à 5 $/mois : inférence de production légère pour moins de 60 $/an

Arrêtez de surpayer les API IA. L'équipe de l'auteur dépensait 8 000 $/an en appels API LLM pour des outils internes. Ce guide détaille le déploiement de Phi-3.5 Mini sur un serveur DigitalOcean à 5 $/mois avec vLLM, de l'installation du serveur à l'intégration API — idéal pour les développeurs indépendants et petites équipes souhaitant réduire les coûts de résumé textuel, classification et raisonnement léger.