小米は2025年11月、GitHub上でスマートホームAIフレームワーク「Xiaomi Miloco(Mi Local Copilot)」をオープンソース化し、現在2.6kのスターを獲得しています。Milocoは、小米の家庭用カメラのリアルタイム映像ストリームを認識入力とし、自社開発の大規模言語モデルを意思決定の中核として、MiHomeエコシステムを通じて家中のすべてのIoTデバイスを接続します。ユーザーが自然言語で家庭のルールや複雑なデバイス連携を定義できるようにすることを目的としており、例えば「誰かが入ってきたら自動で電気をつけ、アナウンスする」や「子どもがリビングに一人でいるときに保護者に通知する」といったことが可能です。プライバシー保護のため、視覚認識はローカルエッジ側で完了します。小米は同時に、家庭向けタスク用に設計された専用の視覚言語モデル「MiMo-VL-Miloco-7B」をオープンソース化しており、推論バックエンドにはllama.cppを使用しています。システム全体はタスクを計画と視覚認識の2つのフェーズに分割し、Dockerによるワンクリックデプロイをサポートしています。ハードウェア要件は、x64アーキテクチャ、NVIDIA 30シリーズ以降のGPU、8GBのVRAM(推奨12GB)、OSはLinux(推奨Ubuntu 22.04+)およびWindows 10+(WSL2が必要)で、macOSは現在サポートしていません。
このプロジェクトは非商用ライセンスに基づいており、小米の書面による許可なしに、アプリケーション、Webサービス、またはその他の形式の商用ソフトウェアの開発には使用できません。研究および個人の探求目的に限ります。Milocoの核となる差別化ポイントは、カメラを単なる防犯ツールから家中のAI認識エントリーポイントへと変え、エッジ推論によってクラウド依存を排除し、家族のAIエージェントが映像データをアップロードすることなくリアルタイム応答を実現できる点にあります。現在、リポジトリには57のIssueと18のPull Requestが活発に存在しており、小米Milocoチームは外部からの人材募集も行っています。