Mem-Agent действует как кросс-платформенный помощник, способный находить ответы на любые вопросы в вашей обширной истории переписок с LLM, базах Notion или документах Google Docs. Это не просто хранилище: агент умеет не только отвечать на запросы, но и запоминать новые факты, а также обновлять их по мере поступления информации.
Как работает память Mem-Agent:
- Вся информация хранится в Markdown-файлах, например, в
memory/user.md
, а также в отдельных файлах для конкретных сущностей. - Связи между файлами реализованы в интуитивно понятном стиле Obsidian с использованием синтаксиса
[[entity]]
. - Агент способен извлекать и обновлять факты, а также задавать уточняющие вопросы, если первоначальный запрос пользователя оказался неполным.
Одним из ключевых преимуществ является эффективная работа с контекстом: вместо обработки огромных объемов данных, Mem-Agent извлекает только необходимые фрагменты из локальных документов, сжимает их и передаёт LLM-агентам для обработки, значительно экономя ресурсы и время.
Технические детали и обучение модели:
- Базовая модель, на которой построен Mem-Agent, — это Qwen3-4B-Thinking-2507.
- Для обучения использовался метод онлайн-RL (GSPO), что позволяет модели постоянно адаптироваться и улучшаться.
- Тестирование производительности проводилось на специализированном бенчмарке md-memory-bench, подтвердившем её эффективность.
Результаты и преимущества:
- Mem-Agent уверенно справляется с задачами, требующими использования памяти, демонстрируя результаты, близкие к показателям значительно более крупных моделей.
- Даже в сжатых версиях (4-bit и 8-bit) качество работы модели остаётся практически неизменным.
- Вся память, управляемая Mem-Agent, является 100% локальной и доступна только вам, обеспечивая полную конфиденциальность.
- Сама модель лёгкая, эффективная и способна запускаться даже на обычном ноутбуке.
- Память можно легко читать и редактировать вручную, предоставляя пользователю полный контроль над своими данными.
- Агент быстро и эффективно работает, несмотря на свой относительно небольшой размер.
- Удобен для интеграции в более крупные системы, например, через MCP.
Исходные коды проекта доступны для изучения и использования: