项目简介

（中文 | English）

XiaoZhi.Net.Server 是使用 .Net 8开发的C# SDK，基于Websocket 协议为 XiaoZhi ESP32 项目提供后端服务支持。

快速开始 👋

快速创建 Xiao Zhi 服务 👇️

IHost? serverHost = null;
// 获取服务引擎构建器
IServerBuilder serverBuilder = EngineFactory.CreateXiaoZhiServerBuilder();
try
{
    Console.WriteLine("Hello, Xiao Zhi!");

    string configJson = File.ReadAllText(Path.Combine(Environment.CurrentDirectory, "configs", "config.json"));

    // 快速从json文件中获取配置信息
    XiaoZhiConfig? config = JsonSerializer.Deserialize<XiaoZhiConfig>(configJson); // 此次省略了对System.Text.Json的一些自定义设置
    if (config is not null)
    {
        // 开始初始化服务
        serverHost = serverBuilder.Initialize(config)
            // 添加插件
            .WithPlugin<GetTime>(nameof(GetTime))
            // 多媒体文件格式支持
            .WithMedia(useFFmpeg: true)
            //.WithManageApi("http://localhost:5118", "your-secret") // 请参考 'XiaoZhi.Net.Sample.OTA.Server' 示例
            // 设置日志输出的语言
            .WithCulture("zh-CN") // 可选，默认为当前环境语言
            // 构建服务引擎
            .Build();

        await serverHost.RunAsync();
    }
    else
    {
        Console.WriteLine("Cannot read the config settings.");
    }
}
catch (Exception ex)
{
    Console.WriteLine($"Got an error: {ex.Message}");
}
finally
{
    if (serverHost is not null)
    {
        await serverHost.StopAsync();
    }
    Console.WriteLine("The server stopped.");
    Console.WriteLine("Press any key to exit...");
    Console.ReadKey();
}

自定义插件 👇️

插件需遵循 SemanticKernel 规范。以下是一个获取当前时间的例子：

using Microsoft.SemanticKernel;
using System.ComponentModel;

[Description("获取关于当前日期和时间插件")]
public class GetTime
{
    [KernelFunction, Description("获取当前的日期和时间")]
    public DateTime GetNowTime()
    {
        return DateTime.Now;
    }
}

目前已测试通过的小智客户端 🖥️

功能清单 ✨

已实现 ✅

功能名称	说明
语音对话	支持实时/手动语音对话，可随时打断，流式TTS返回，兼容多语种，长时间无对话时自动休眠
自定义插件	支持自定义插件函数，方便LLM调用
IOT/MCP	同时支持两种协议调用（IOT协议后续将会被移除）
短期记忆	以设备和单次连接为单位的短期记忆缓存
多媒体音频播放	得益于ffmpeg（v7.1.1）编码支持，可以播放常见格式的音频文件
音频重采样	可自定义设置服务端TTS输出采样率
音频文件保存	可以通过配置文件来设置是否保存用户说话的音频和TTS生成的音频
连接验证	可根据小智设备信息进行连接服务器前的登入验证

正在开发 🚧

已接入的平台/使用的模型列表 📋

LLM 语言模型

* 以下模型均以OpenAI的API规范进行调用

平台名称	查看密钥申请
智谱（ChatGLMLLM，免费）	密钥
DeepSeek	密钥
Doubao（火山引擎）	密钥
Qwen（阿里百炼）	密钥

TTS 语音合成

平台 / 模型名称	备注
Kokoro	基于 sherpa-onnx 实现
火山引擎	支持双向websocket流式、http调用

VAD 语音活动检测

模型名称	备注
SileroVAD	基于 sherpa-onnx 实现
SileroNative	基于 Microsoft.ML.OnnxRuntime 实现

ASR 语音识别

平台 / 模型名称	备注
Sense Voice	基于 sherpa-onnx 实现
Paraformer	基于 sherpa-onnx 实现

Memory 记忆存储

平台 / 模型名称	备注
内存缓存	服务端停止或连接断开后所有记忆将会丢失

注意事项⚠️

一、文件目录

.
├── configs
│   ├── assets # 系统语音音频文件
│   │   ├── bind_codes # 数字播报音频文件
│   │   ├── bind_code.wav
│   │   ├── bind_not_found.wav
│   │   └── ...
│   └── config.json # 主配置文件
├── data
│   ├── asr-cache  # 当开启保存用于asr识别的音频文件后，用户说话的音频将会保存在这里
│   └── tts-cache # 当开启保存tts生成的文件后，生成的语音将会保存在这里
├── ffmpeg # 存放 ffmpeg v7.1.1 二进制文件
├── logs # 系统日志文件
├── models  # 所有模型存放的目录
│   ├── asr  # 模型类型
│   │   └── sense-voice  # 模型名称文件夹
│   │       ├── model.onnx  # 模型文件
│   │       └── tokens.txt  # 模型所需tokens文件
│   ├── tts
│   │   └── kokoro
│   │       ├── dict
│   │       ├── espeak-ng-data
│   │       ├── lexicon
│   │       │   └── lexicon-xxxx.txt  # 余下的3个txt文件
│   │       ├── model.onnx  # 模型文件
│   │       ├── tokens.txt  # 模型所需tokens文件
│   │       └── voices.bin  # 模型音色文件
│   └── vad
│       ├── silero
│       │   └── model.onnx  # 模型文件
│       └── silero-native
│           └── model.onnx  # 模型文件
├── musics  # 本地音乐文件目录
└── XiaoZhi.Net.Test.exe # 测试主程序

二、模型使用

使用打包好的模型

直接在 Resource Files 中下载已经打包好的模型资源，解压后将模型文件放在对应的models文件夹中即可。

使用其他模型

若需要接入自定义模型，请参阅如何扩展自定义模型文档。

* 注意模型文件.onnx需要统一命名为model.onnx

三、程序运行

点击 XiaoZhi.Net.Sample.Server.exe 运行后，将会在控制台中显示当前监听的 websocket 地址，将其复制到你的小智客户端中即可。

如果需要完整打印服务端日志，可以在 config.json 中将 LogSetting 项的 LogLevel 改为 DEBUG。

贡献🙌

本项目初衷是为 .Net 生态贡献一份力，抛砖引玉。

由于目前只实现了基础功能，在项目使用中如果遇到任何问题，欢迎提交 Issues 和 Pull Requests！

At the same time, I will also do my best to develop / maintain this project :D

特别鸣谢

项目名称
xiaozhi esp32
xiaozhi-esp32-server
sherpa-onnx
SuperSocket

许可证📝

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 161 Commits
demo		demo
docs		docs
src		src
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
README_en.md		README_en.md
XiaoZhi.Net.sln		XiaoZhi.Net.sln

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

项目简介

快速开始 👋

快速创建 Xiao Zhi 服务 👇️

自定义插件 👇️

目前已测试通过的小智客户端 🖥️

功能清单 ✨

已实现 ✅

正在开发 🚧

已接入的平台/使用的模型列表 📋

LLM 语言模型

TTS 语音合成

VAD 语音活动检测

ASR 语音识别

Memory 记忆存储

注意事项⚠️

一、文件目录

二、模型使用

三、程序运行

贡献🙌

特别鸣谢

许可证📝

About

Uh oh!

Releases 3

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

项目简介

快速开始 👋

快速创建 Xiao Zhi 服务 👇️

自定义插件 👇️

目前已测试通过的小智客户端 🖥️

功能清单 ✨

已实现 ✅

正在开发 🚧

已接入的平台/使用的模型列表 📋

LLM 语言模型

TTS 语音合成

VAD 语音活动检测

ASR 语音识别

Memory 记忆存储

注意事项⚠️

一、文件目录

二、模型使用

三、程序运行

贡献🙌

特别鸣谢

许可证📝

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 3

Uh oh!

Contributors

Uh oh!

Languages