{"id":23938,"date":"2026-06-03T17:07:22","date_gmt":"2026-06-03T15:07:22","guid":{"rendered":"https:\/\/www.kaspersky.fr\/blog\/?p=23938"},"modified":"2026-06-03T17:07:22","modified_gmt":"2026-06-03T15:07:22","slug":"llmjacking-2026-private-ai-server-security","status":"publish","type":"post","link":"https:\/\/www.kaspersky.fr\/blog\/llmjacking-2026-private-ai-server-security\/23938\/","title":{"rendered":"Les pillards de mod\u00e8les LLM et comment les repousser"},"content":{"rendered":"<p>La s\u00e9curit\u00e9 de l\u2019IA ne se limite pas \u00e0 la pr\u00e9vention du vol de donn\u00e9es, \u00e0 la limitation des <a href=\"https:\/\/www.kaspersky.fr\/blog\/moltbot-enterprise-risk-management\/23656\/\" target=\"_blank\" rel=\"noopener\">agents d\u2019IA malveillants<\/a> ou \u00e0 \u00e9viter que les assistants ne donnent des conseils pr\u00e9judiciables. Une menace relativement simple, mais qui prend rapidement de l\u2019ampleur, a fait son apparition\u00a0: il s\u2019agit des tentatives de d\u00e9tournement de puissance de calcul et d\u2019exploitation du r\u00e9seau neuronal d\u2019autrui \u00e0 des fins personnelles. C\u2019est ce qu\u2019on appelle le LLMjacking. Alors que l\u2019on s\u2019attend g\u00e9n\u00e9ralement \u00e0 ce que les co\u00fbts li\u00e9s au calcul d\u2019IA <a href=\"https:\/\/oplexa.com\/ai-inference-cost-crisis-2026\/\" target=\"_blank\" rel=\"noopener nofollow\">augmentent consid\u00e9rablement<\/a>, le nombre de cyberattaques motiv\u00e9es par ces raisons devrait s\u2019accro\u00eetre. Par cons\u00e9quent, lors du d\u00e9ploiement de serveurs d\u2019IA propri\u00e9taires et des \u00e9cosyst\u00e8mes qui les accompagnent, tels que <a href=\"https:\/\/fr.wikipedia.org\/wiki\/G%C3%A9n%C3%A9ration_%C3%A0_enrichissement_contextuel\" target=\"_blank\" rel=\"noopener nofollow\">RAG<\/a> ou <a href=\"https:\/\/fr.wikipedia.org\/wiki\/Model_Context_Protocol\" target=\"_blank\" rel=\"noopener nofollow\">MCP<\/a>, il est essentiel de mettre en place des mesures de s\u00e9curit\u00e9 rigoureuses d\u00e8s le premier jour.<\/p>\n<h2>Statistiques provenant d\u2019un pot de miel (honeypot)<\/h2>\n<p>C\u2019est une <a href=\"https:\/\/web.archive.org\/web\/20260412230759\/https:\/www.reddit.com\/r\/ollama\/comments\/1sff7i0\/30_days_of_an_llm_honeypot\/?solution=64b4494d52a1506664b4494d52a15066&amp;js_challenge=1&amp;token=bbbe4bf1c9a2b5160829c4be34da586161e5e506c5ef56a1c8acb5184e8d115f\" target=\"_blank\" rel=\"noopener nofollow\">exp\u00e9rience<\/a> document\u00e9e en d\u00e9tail en avril\u00a02026 qui illustre le mieux la rapidit\u00e9 et l\u2019ampleur de ces tentatives de d\u00e9tournement de ressources. L\u2019enqu\u00eateur a configur\u00e9 un Raspberry Pi pour qu\u2019il se fasse passer pour un serveur d\u2019IA priv\u00e9 hautes performances et l\u2019a rendu accessible \u00e0 partir d\u2019Internet. Interrog\u00e9, il signalait la disponibilit\u00e9 des serveurs Ollama, LM Studio, AutoGPT, LangServe et text-gen-webui, soit des outils couramment utilis\u00e9s comme interfaces pour les mod\u00e8les d\u2019IA h\u00e9berg\u00e9s localement. Le serveur semblait \u00e9galement pr\u00eat \u00e0 accepter les requ\u00eates API au format OpenAI, qui est d\u00e9sormais la norme dans le secteur.<\/p>\n<p>Tous ces services semblaient fonctionner gr\u00e2ce \u00e0 une instance locale de Qwen3-Coder 30B Heretic, l\u2019un des mod\u00e8les open source les plus puissants, dont les m\u00e9canismes d\u2019alignement de s\u00e9curit\u00e9 avaient \u00e9t\u00e9 d\u00e9sactiv\u00e9s. Pour couronner le tout, le pot de miel a signal\u00e9 la pr\u00e9sence de diverses bases de donn\u00e9es RAG et d\u2019un serveur MCP dot\u00e9 de fonctionnalit\u00e9s all\u00e9chantes telles que \u00ab\u00a0<em>get_credentials<\/em>\u00ab\u00a0.<\/p>\n<p>En r\u00e9alit\u00e9, le Raspberry Pi h\u00e9bergeait simplement 500\u00a0r\u00e9ponses pr\u00e9enregistr\u00e9es issues d\u2019un v\u00e9ritable mod\u00e8le Qwen3, et un script l\u00e9ger s\u00e9lectionnait la r\u00e9ponse la plus pertinente pour chaque requ\u00eate entrante. Ce dispositif a suffi \u00e0 passer un contr\u00f4le sommaire tout en permettant au chercheur d\u2019\u00e9valuer les intentions des pirates informatiques.<\/p>\n<p>Selon l\u2019auteur, Shodan, un service d\u2019analyse Internet tr\u00e8s populaire, a d\u00e9tect\u00e9 le serveur dans les trois heures qui ont suivi sa mise en ligne. \u00c0 peine une heure plus tard, des demandes ressemblant \u00e0 des missions de reconnaissance des capacit\u00e9s ont commenc\u00e9 \u00e0 affluer. Au cours du mois suivant, le serveur a trait\u00e9 plus de 113\u00a0000\u00a0requ\u00eates provenant de milliers d\u2019adresses IP uniques, dont 23\u00a0% du trafic visait pr\u00e9cis\u00e9ment \u00e0 d\u00e9couvrir les capacit\u00e9s de l\u2019IA et \u00e0 exploiter les mod\u00e8les de langage grand public (LLM) et les agents d\u2019IA locaux.<\/p>\n<p>Les requ\u00eates envoy\u00e9es aux terminaux, comme <em>\/api\/tags<\/em> et <em>\/v1\/models<\/em>, permettent aux pirates informatiques d\u2019identifier les mod\u00e8les h\u00e9berg\u00e9s sur un serveur, tandis que la recherche du r\u00e9pertoire <em>\/.cursor\/rules<\/em> pr\u00e9c\u00e8de g\u00e9n\u00e9ralement une tentative d\u2019exploitation d\u2019un agent d\u2019IA. De m\u00eame, la recherche de <em>\/.well-known\/mcp.json<\/em> permet de dresser un inventaire des serveurs MCP de la victime. Bien que l\u2019auteur ne mentionne pas le nombre total d\u2019attaques ayant d\u00e9pass\u00e9 le stade de la simple analyse, on a recens\u00e9 175\u00a0tentatives actives de d\u00e9tournement du mod\u00e8le LLM rien que durant la derni\u00e8re semaine de l\u2019exp\u00e9rience.<\/p>\n<h2>Que recherchent les pirates\u00a0?<\/h2>\n<p>D\u2019apr\u00e8s les observations du chercheur, aucune des attaques visant le serveur factice n\u2019a tent\u00e9 d\u2019ex\u00e9cuter du code arbitraire ou d\u2019obtenir un acc\u00e8s root. (Note de la r\u00e9daction\u00a0: cela est surprenant et pourrait indiquer des lacunes dans la journalisation.) Presque toutes les attaques visaient \u00e0 d\u00e9tourner des ressources. Par exemple, les activit\u00e9s suivantes ont \u00e9t\u00e9 enregistr\u00e9es au cours de l\u2019exp\u00e9rience\u00a0:<\/p>\n<ul>\n<li>Une tentative bien structur\u00e9e d\u2019analyse de la documentation technique d\u2019un microprocesseur<\/li>\n<li>Une invite pour \u00e9crire un roman \u00e9rotique<\/li>\n<li>Demandes d\u2019analyse et de structuration des donn\u00e9es textuelles issues des r\u00e9seaux sociaux concernant de nouvelles vuln\u00e9rabilit\u00e9s<\/li>\n<li>Une tentative d\u2019appel des mod\u00e8les Anthropic en utilisant le serveur compromis comme proxy d\u2019API<\/li>\n<\/ul>\n<p>Il convient de noter que l\u2019analyse des ressources en mati\u00e8re d\u2019IA s\u2019appuie sur des outils standardis\u00e9s et en constante \u00e9volution. Les requ\u00eates provenant d\u2019une application nomm\u00e9e LLM-Scanner ont \u00e9t\u00e9 \u00e9mises depuis l\u2019infrastructure de sept fournisseurs de services cloud diff\u00e9rents r\u00e9partis dans huit pays, ce qui laisse supposer que les pirates ont mis en place des m\u00e9thodes bien rod\u00e9es, ainsi que des plateformes sp\u00e9cialis\u00e9es pour le partage de techniques. \u00c0 la troisi\u00e8me semaine de l\u2019exp\u00e9rience, le scanner avait \u00e9t\u00e9 mis \u00e0 jour avec une v\u00e9rification suppl\u00e9mentaire\u00a0: il utilisait d\u00e9sormais des questions abstraites pour d\u00e9terminer s\u2019il interagissait avec une IA active ou avec un pot de miel renvoyant des r\u00e9ponses toutes faites.<\/p>\n<p>Parmi les attaques non cibl\u00e9es, l\u2019exp\u00e9rience a permis de recenser de nombreuses tentatives visant \u00e0 extraire des identifiants du fichier <em>.env<\/em>. Les pirates ont syst\u00e9matiquement recherch\u00e9 ce fichier dans tous les r\u00e9pertoires imaginables du serveur. L\u2019une des erreurs les plus \u00e9l\u00e9mentaires lors du d\u00e9ploiement de projets sur Laravel, <em>Node.js<\/em> et d\u2019autres frameworks est de laisser un fichier <em>.env<\/em> accessible au public. Pourtant, cette n\u00e9gligence reste courante, en particulier chez les d\u00e9butants et les \u00ab\u00a0vibe codeurs\u00a0\u00bb. Les pirates ont donc toutes les raisons de penser que leurs efforts porteront leurs fruits.<\/p>\n<h2>Conclusions et conseils de d\u00e9fense<\/h2>\n<p>La recherche de serveurs accessibles au public et les tentatives d\u2019exploitation de ceux-ci ne sont pas un ph\u00e9nom\u00e8ne r\u00e9cent, mais l\u2019essor des mod\u00e8les LLM offre aux pirates un nouveau moyen de mon\u00e9tiser leurs efforts \u2013 un moyen \u00e0 la fois tr\u00e8s lucratif pour eux et d\u00e9vastateur pour leurs victimes. Pour se rendre compte de l\u2019ampleur que ces attaques pourraient prendre, il suffit de se pencher sur leur \u00e9quivalent le plus proche\u00a0: le march\u00e9 du cryptojacking, qui consiste pour les criminels \u00e0 miner des cryptomonnaies en utilisant des ressources informatiques vol\u00e9es. Ce march\u00e9 <a href=\"https:\/\/www.economist.com\/science-and-technology\/2026\/04\/22\/crypto-miners-are-quietly-colonising-computers\" target=\"_blank\" rel=\"noopener nofollow\">a connu une croissance de 20\u00a0% rien qu\u2019en 2025<\/a>. Avec la multiplication des solutions bas\u00e9es sur l\u2019IA, l\u2019augmentation des co\u00fbts d\u2019abonnement pratiqu\u00e9e par les grands fournisseurs et la p\u00e9nurie persistante de puces d\u2019IA locales, il faut s\u2019attendre \u00e0 ce que le LLMjacking devienne un ph\u00e9nom\u00e8ne de grande ampleur.<\/p>\n<p>Mesures de s\u00e9curit\u00e9 essentielles pour les infrastructures d\u2019IA priv\u00e9es<\/p>\n<ul>\n<li>Pour les syst\u00e8mes d\u2019IA fonctionnant localement sur une seule machine, assurez-vous que les serveurs tels que LM Studio, Ollama ou autres sont configur\u00e9s pour accepter les connexions uniquement sur l\u2019interface locale (localhost), et non sur toutes les interfaces r\u00e9seau disponibles. Ainsi, l\u2019acc\u00e8s au LLM est limit\u00e9 \u00e0 la machine h\u00f4te elle-m\u00eame, ce qui emp\u00eache l\u2019IA d\u2019\u00eatre accessible via Internet.<\/li>\n<li>Pour les serveurs traitant des requ\u00eates \u00e0 distance (m\u00eame s\u2019ils fonctionnent uniquement au sein d\u2019un r\u00e9seau d\u2019entreprise local), mettez en place un <a href=\"https:\/\/www.kaspersky.com\/blog\/how-to-benefit-from-identity-security\/48399\/\" target=\"_blank\" rel=\"noopener nofollow\">syst\u00e8me d\u2019authentification et d\u2019autorisation solide<\/a> plut\u00f4t que de vous fier uniquement \u00e0 la validation des cl\u00e9s API. Les solutions bas\u00e9es sur les protocoles OIDC ou OAuth2 utilisant des jetons de courte dur\u00e9e sont les plus efficaces. Elles permettent non seulement de se pr\u00e9munir contre le LLMjacking, mais aussi d\u2019assurer un suivi plus pr\u00e9cis de l\u2019activit\u00e9 des utilisateurs et d\u2019emp\u00eacher l\u2019utilisation abusive des cl\u00e9s API. De plus, les cl\u00e9s ne doivent pas seulement \u00eatre prot\u00e9g\u00e9es contre les attaquants externes. Le risque croissant r\u00e9side dans <a href=\"https:\/\/www.theregister.com\/2026\/04\/27\/cursoropus_agent_snuffs_out_pocketos\/\" target=\"_blank\" rel=\"noopener nofollow\">l\u2019utilisation abusive des cl\u00e9s par les agents d\u2019IA<\/a> eux-m\u00eames. C\u2019est le cas aussi bien pour les interfaces LLM que pour les MCP, les RAG et autres.<\/li>\n<li>Utilisez la segmentation du r\u00e9seau et les listes d\u2019adresses IP autoris\u00e9es pour limiter l\u2019acc\u00e8s au serveur d\u2019IA aux seuls d\u00e9partements, employ\u00e9s et services qui en ont besoin.<\/li>\n<li>Assurez-vous que toutes les connexions client-serveur sont s\u00e9curis\u00e9es \u00e0 l\u2019aide d\u2019une version r\u00e9cente du protocole TLS.<\/li>\n<li>Appliquez le <a href=\"https:\/\/www.kaspersky.com\/blog\/what-is-the-principle-of-least-privilege\/50232\/\" target=\"_blank\" rel=\"noopener nofollow\">principe du moindre privil\u00e8ge<\/a> en s\u00e9parant les acc\u00e8s aux diff\u00e9rents services. Par exemple, les composants MCP et LLM devraient disposer de leurs propres jetons d\u2019acc\u00e8s distincts.<\/li>\n<li>Assurez-vous qu\u2019un <a href=\"https:\/\/www.kaspersky.fr\/enterprise-security\/endpoint-detection-response-edr?icid=fr_kdailyplacehold_acq_ona_smm__onl_b2b_kasperskydaily_wpplaceholder_______\" target=\"_blank\" rel=\"noopener\">agent de s\u00e9curit\u00e9 EDR<\/a> est install\u00e9 sur tous les postes de travail et serveurs, y compris ceux qui h\u00e9bergent des mod\u00e8les d\u2019IA.<\/li>\n<li>Surveillez la consommation des ressources d\u2019IA, d\u00e9finissez des quotas d\u2019utilisation pour les diff\u00e9rents postes, et configurez des alertes en cas de pics d\u2019activit\u00e9 anormaux.<\/li>\n<li>Conservez des journaux d\u00e9taill\u00e9s des r\u00e9ponses des mod\u00e8les LLM ainsi que des requ\u00eates adress\u00e9es au mod\u00e8le et \u00e0 ses outils associ\u00e9s. Int\u00e9grez ces sources de donn\u00e9es \u00e0 <a href=\"https:\/\/www.kaspersky.fr\/enterprise-security\/managed-detection-and-response?icid=fr_kdailyplacehold_acq_ona_smm__onl_b2b_kasperskydaily_wpplaceholder_______\" target=\"_blank\" rel=\"noopener\">votre syst\u00e8me SIEM<\/a>. Veillez \u00e0 ce que les journaux soient prot\u00e9g\u00e9s contre toute alt\u00e9ration ou suppression.<\/li>\n<\/ul>\n<input type=\"hidden\" class=\"category_for_banner\" value=\"mdr\"><input type=\"hidden\" class=\"placeholder_for_banner\" data-cat_id=\"mdr\" value=\"22895\">\n","protected":false},"excerpt":{"rendered":"<p>Les tentatives de d\u00e9tournement des ressources d&rsquo;IA se produisent d\u00e9sormais \u00e0 grande \u00e9chelle. Comment les infrastructures d&rsquo;IA sont-elles vis\u00e9es et quelles mesures de d\u00e9fense devriez-vous mettre en place ?<\/p>\n","protected":false},"author":2722,"featured_media":23940,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[686],"tags":[3383,4556,4357,61,1450],"class_list":{"0":"post-23938","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-threats","8":"tag-ia","9":"tag-llm","10":"tag-machine-learning","11":"tag-securite","12":"tag-serveurs"},"hreflang":[{"hreflang":"fr","url":"https:\/\/www.kaspersky.fr\/blog\/llmjacking-2026-private-ai-server-security\/23938\/"},{"hreflang":"en-in","url":"https:\/\/www.kaspersky.co.in\/blog\/llmjacking-2026-private-ai-server-security\/30714\/"},{"hreflang":"en-ae","url":"https:\/\/me-en.kaspersky.com\/blog\/llmjacking-2026-private-ai-server-security\/25767\/"},{"hreflang":"en-gb","url":"https:\/\/www.kaspersky.co.uk\/blog\/llmjacking-2026-private-ai-server-security\/30564\/"},{"hreflang":"es","url":"https:\/\/www.kaspersky.es\/blog\/llmjacking-2026-private-ai-server-security\/32133\/"},{"hreflang":"it","url":"https:\/\/www.kaspersky.it\/blog\/llmjacking-2026-private-ai-server-security\/30696\/"},{"hreflang":"ru","url":"https:\/\/www.kaspersky.ru\/blog\/llmjacking-2026-private-ai-server-security\/41840\/"},{"hreflang":"tr","url":"https:\/\/www.kaspersky.com.tr\/blog\/llmjacking-2026-private-ai-server-security\/14558\/"},{"hreflang":"x-default","url":"https:\/\/www.kaspersky.com\/blog\/llmjacking-2026-private-ai-server-security\/55768\/"},{"hreflang":"pt-br","url":"https:\/\/www.kaspersky.com.br\/blog\/llmjacking-2026-private-ai-server-security\/25008\/"},{"hreflang":"de","url":"https:\/\/www.kaspersky.de\/blog\/llmjacking-2026-private-ai-server-security\/33508\/"},{"hreflang":"ru-kz","url":"https:\/\/blog.kaspersky.kz\/llmjacking-2026-private-ai-server-security\/30650\/"},{"hreflang":"en-au","url":"https:\/\/www.kaspersky.com.au\/blog\/llmjacking-2026-private-ai-server-security\/36224\/"},{"hreflang":"en-za","url":"https:\/\/www.kaspersky.co.za\/blog\/llmjacking-2026-private-ai-server-security\/36116\/"}],"acf":[],"banners":"","maintag":{"url":"https:\/\/www.kaspersky.fr\/blog\/tag\/ia\/","name":"IA"},"_links":{"self":[{"href":"https:\/\/www.kaspersky.fr\/blog\/wp-json\/wp\/v2\/posts\/23938","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.kaspersky.fr\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.kaspersky.fr\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.kaspersky.fr\/blog\/wp-json\/wp\/v2\/users\/2722"}],"replies":[{"embeddable":true,"href":"https:\/\/www.kaspersky.fr\/blog\/wp-json\/wp\/v2\/comments?post=23938"}],"version-history":[{"count":3,"href":"https:\/\/www.kaspersky.fr\/blog\/wp-json\/wp\/v2\/posts\/23938\/revisions"}],"predecessor-version":[{"id":23942,"href":"https:\/\/www.kaspersky.fr\/blog\/wp-json\/wp\/v2\/posts\/23938\/revisions\/23942"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.kaspersky.fr\/blog\/wp-json\/wp\/v2\/media\/23940"}],"wp:attachment":[{"href":"https:\/\/www.kaspersky.fr\/blog\/wp-json\/wp\/v2\/media?parent=23938"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.kaspersky.fr\/blog\/wp-json\/wp\/v2\/categories?post=23938"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.kaspersky.fr\/blog\/wp-json\/wp\/v2\/tags?post=23938"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}