**Patrice Ferlet aka MΣƬΛᄂ3D** @metal3d@techlover.eu · 10 juil. 2024, 14:21

**Patrice Ferlet aka MΣƬΛᄂ3D** @metal3d@techlover.eu · 10 juil. 2024, 14:21

Patrice Ferlet aka MΣƬΛᄂ3D @metal3d@techlover.eu

10 juil. 2024, 14:21

Patrice Ferlet aka MΣƬΛᄂ3D @metal3d@techlover.eu

Au taff, on vient de recycler un vieux coucou avec 6 cartes GTX 1070 Ti, des trucs de 2017 dits "désuets" par #Nvidia.
#llamacpp démarre un #Mixtral8x7b réparti sur les cartes... Et ça va plus vite que ChatGPT.
Une interface codée en #gradio de 30 lignes.
Si ça c'est pas rentabiliser !

PS: on va virer CUDA et utiliser #Vulkan d'ici peu

d829c24f467e23ab.png

**Patrice Ferlet aka MΣƬΛᄂ3D** @metal3d@techlover.eu · 13 juil. 2024, 05:32

**Patrice Ferlet aka MΣƬΛᄂ3D** @metal3d@techlover.eu · 13 juil. 2024, 05:32

13 juil. 2024, 05:32

Patrice Ferlet aka MΣƬΛᄂ3D @metal3d@techlover.eu

Impressionné par llamacpp et sa capacité à splitet les modèles sur plusieurs GPU, je me suis dit "tiens bah on va brancher ma vieille GTX 1060 pour donner 3Go de plus à ma RTX 3070".
Et ça fonctionne bon sang... Me reste à tester le mode RPC pour utiliser la 3060 de mon laptop en réseau.
Llamacpp c'est tout simplement un coup de génie.

**Patrice Ferlet aka MΣƬΛᄂ3D** @metal3d@techlover.eu · 2024-07-17T09:04:30Z

Patrice Ferlet aka MΣƬΛᄂ3D @metal3d@techlover.eu

Mode RPC testé. C'est super efficace, le modèle se répartit super bien sur les cartes graphiques du réseau.
C'est lent à charger par contre (au démarrage), mais les inférences sont très rapides, presque comme si on faisait tout tourner localement.
Donc, si vous avez plusieurs PC/Mac et que vous voulez charger des gros modèles, c'est clairement bien foutu.
#llamacpp est tout simplement épatant.

17 juil. 2024, 09:04 · · · ·

Inscrivez-vous pour prendre part à la conversation

Tendance en ce moment

Ressources

Développeurs

Qu’est-ce que Mastodon ?

techlover.eu

Davantage…

Tendance en ce moment

Ressources

Développeurs

Qu’est-ce que Mastodon ?

techlover.eu

Davantage…

Qu’est-ce que Mastodon ?