MLX runtime

MLX pour exploiter Apple Silicon dans Twoody Private LLM. MLX to use Apple Silicon in Twoody Private LLM.

MLX est pertinent quand la machine cible est un Mac Apple Silicon. Twoody l'inscrit dans une architecture plus large : serveur privé, apps, documents, tunnel et diagnostics. MLX is relevant when the target machine is an Apple Silicon Mac. Twoody places it in a broader architecture: private server, apps, documents, tunnel and diagnostics.

Ce que ça fait What it does

Apple Silicon Apple Silicon

MLX cible les puces Apple et leur mémoire unifiée. MLX targets Apple chips and their unified memory.

Mesures locales Local metrics

RAM, latence et tok/s se lisent sur la machine. RAM, latency and tok/s are read on the machine.

Couche produit Product layer

Twoody ajoute les apps et la gouvernance autour du runtime. Twoody adds apps and governance around the runtime.

Comment ça marche How it works

01

Vérifier le Mac Check the Mac

Valider Apple Silicon, RAM et stockage. Validate Apple Silicon, RAM and storage.

02

Installer MLX Install MLX

Installer la stack et le modèle cible. Install the stack and target model.

03

Connecter Twoody Connect Twoody

Déclarer le runtime dans Twoody Server. Register the runtime in Twoody Server.

04

Mesurer Measure

Observer performance et confort d'usage. Observe performance and usage comfort.

Détails techniques Technical details

Mémoire unifiée Unified memory

Sur Apple Silicon, le sizing dépend surtout de la mémoire unifiée disponible, du modèle et de la fenêtre de contexte. On Apple Silicon, sizing mostly depends on available unified memory, model choice and context window.

Bridge endpoint Bridge endpoint

MLX peut rester un runtime local exposé via Bridge ou wrapper compatible, pendant que Twoody Server conserve le routage. MLX can remain a local runtime exposed through Bridge or a compatible wrapper while Twoody Server keeps routing.

Confort machine Machine comfort

Les signaux à suivre sont RAM, pression mémoire, chauffe, tok/s et stabilité du service local. Signals to watch are RAM, memory pressure, thermals, tok/s and local service stability.

FAQ

MLX remplace-t-il Ollama ? Does MLX replace Ollama?

Non. Ce sont deux options de runtime. Le choix dépend de la machine et du niveau de contrôle voulu. No. They are two runtime options. The choice depends on the machine and desired control level.

Faut-il montrer MLX aux utilisateurs ? Should users see MLX?

Pas forcément. L'utilisateur peut rester dans l'app Twoody pendant que l'admin choisit MLX côté serveur. Not necessarily. The user can stay in the Twoody app while the admin chooses MLX server-side.

Sources officielles Official sources