Essais et usage solo Trials and solo use
Bon point de départ pour tester Twoody Private, installer des modèles 3B-8B et valider les workflows. A good starting point to try Twoody Private, install 3B-8B models and validate workflows.
La bonne machine dépend du modèle, du contexte, du nombre d'utilisateurs et du mode d'hébergement. Ces recommandations donnent des ordres de grandeur, pas des promesses absolues. The right machine depends on the model, context, number of users and hosting mode. These recommendations are rough sizing guides, not absolute promises.
Bon point de départ pour tester Twoody Private, installer des modèles 3B-8B et valider les workflows. A good starting point to try Twoody Private, install 3B-8B models and validate workflows.
Le meilleur équilibre pour un usage quotidien : Qwen 8B/14B, Qwen Coder 14B, documents et apps en parallèle. The best balance for daily use: Qwen 8B/14B, Qwen Coder 14B, documents and apps in parallel.
Plus de marge pour Qwen 32B, plusieurs usages simultanes, contexte plus long et index documentaires. More headroom for Qwen 32B, multiple simultaneous uses, longer context and document indexes.
Pour très long contexte, gros modèles, tests intensifs et plusieurs pipelines locaux. For very long context, large models, intensive tests and several local pipelines.
Excellent pour démarrer avec une machine fixe, silencieuse et simple à héberger au bureau ou chez soi. Excellent to start with a fixed, quiet machine that is easy to host at home or in an office.
Pratique si la même machine sert au travail quotidien et au serveur de modèles hors déplacement. Useful if the same machine is used for daily work and model serving when not traveling.
Le choix naturel quand la RAM, le débit et la marge comptent plus que la mobilité. The natural choice when RAM, throughput and headroom matter more than mobility.
Option utile si vous préférez commencer sans acheter de machine ou sans exploiter l'infra vous-même. Useful if you prefer to start without buying a machine or operating infrastructure yourself.
Ces chiffres viennent du catalogue Twoody Mac/MLX et servent à comparer les ordres de grandeur. These figures come from the Twoody Mac/MLX catalog and are meant to compare rough orders of magnitude.
| ModeleModel | DisqueDisk | RAM | tok/s | UsageUse |
|---|---|---|---|---|
| Phi-3.5 mini | 2.3 GB | 3 GB | 55 | Très rapide, faible RAM, premier assistant privé. Very fast, low RAM, first private assistant. |
| Llama 3.2 3B | 2.0 GB | 3 GB | 50 | Modèle léger pour chat simple et tests. Light model for simple chat and tests. |
| Qwen 4B | 2.5 GB | 3.5 GB | 45 | Usage courant avec bon équilibre vitesse/qualité. Everyday use with a good speed/quality balance. |
| Qwen 8B/9B | 5-5.5 GB | 6.5-7 GB | 23-25 | Généraliste solide, français, outils et documents. Solid generalist, French, tools and documents. |
| Qwen 14B | 8 GB | 10 GB | 14 | Travail serieux, agents, meilleure precision. Serious work, agents, better accuracy. |
| Qwen Coder 14B | 8.3 GB | 10 GB | 13 | Code, scripts, SQL et refactorings. Code, scripts, SQL and refactors. |
| DeepSeek distill 7B/14B | 4.3-8 GB | 5.5-10 GB | 14-32 | Raisonnement, maths et code. Reasoning, math and code. |
| Qwen 32B | 18 GB | 21 GB | 6 | Qualité locale supérieure, machine 48 GB+ conseillée. Higher local quality, 48 GB+ machine recommended. |
Ordres de grandeur : quantization 4-bit, génération courte, Apple Silicon, MLX. La vitesse dépend de la machine, du contexte, de la quantization, de la charge et de la version du runtime. Rough figures: 4-bit quantization, short generation, Apple Silicon, MLX. Speed depends on machine, context, quantization, load and runtime version.
Acheter une machine est une option, pas une obligation. Twoody Server peut tourner sur votre infra, chez un hébergeur que vous contrôlez, ou en mode managé. La promesse “Twoody ne reçoit pas vos messages” concerne le self-hosted strict. Buying a machine is an option, not a requirement. Twoody Server can run on your infrastructure, with a host you control, or in managed mode. The “Twoody does not receive your messages” promise applies to strict self-hosting.
Non. C'est une bonne option pour la marge et les gros modèles, mais Mac mini, MacBook Pro et hébergement managé peuvent être plus pertinents selon le budget et l'usage. No. It is a good option for headroom and larger models, but Mac mini, MacBook Pro and managed hosting may fit better depending on budget and usage.
Pour les LLM locaux, la RAM détermine d'abord quels modèles et quels contextes tiennent. Le processeur et l'accélération influencent ensuite la vitesse. For local LLMs, RAM first determines which models and contexts fit. Processor and acceleration then influence speed.