小智AI聊天機(jī)器人是一款基于樂(lè)鑫ESP32-S3核心板,搭載多種開(kāi)源AI大模型( DeepSeek、OpenAI 、通義Qwen),通過(guò)對(duì)話角色自定義、海量知識(shí)庫(kù)、長(zhǎng)期記憶、語(yǔ)音聲紋識(shí)別等功能。它不僅是智能工具,更是一個(gè)真正“懂你”的AI助理,致力于為每一天增添溫暖和便利。無(wú)論是在解決問(wèn)題還是分享快樂(lè),小智AI聊天機(jī)器人都以獨(dú)特的智慧和溫柔的方式,使科技更加有溫度,生活更美好。
基于 xiaozhi-esp32 協(xié)議,通過(guò) WebSocket 實(shí)現(xiàn)數(shù)據(jù)交互。
對(duì)話交互
支持喚醒對(duì)話、手動(dòng)對(duì)話及實(shí)時(shí)打斷。長(zhǎng)時(shí)間無(wú)對(duì)話時(shí)自動(dòng)休眠
多語(yǔ)言識(shí)別
支持國(guó)語(yǔ)、粵語(yǔ)、英語(yǔ)、日語(yǔ)、韓語(yǔ)(默認(rèn)使用 FunASR)。
LLM 模塊
支持靈活切換 LLM 模塊,可選阿里通義Qwen、DeepSeek、OpenAI 等
TTS 模塊
支持 EdgeTTS(默認(rèn))、火山引擎豆包 TTS 等多種 TTS 接口,滿足語(yǔ)音合成需求。
小智AI聊天機(jī)器人功能介紹
無(wú)論是科學(xué)知識(shí)、歷史文化,還是生活常識(shí)、娛樂(lè)八卦,小智AI聊天機(jī)器人都能信手拈來(lái),讓每一次對(duì)話都充滿趣味和驚喜。用戶可以與小智AI聊天機(jī)器人暢聊各種話題,從宇宙奧秘到生活瑣碎,都能得到有趣又有心意的答復(fù)。
此外,小智AI聊天機(jī)器人還支持對(duì)話角色自由切換定制,不同性格特長(zhǎng)的對(duì)話角色可以滿足用戶的一切對(duì)話需求。無(wú)論是幽默風(fēng)趣的喜劇演員,還是博學(xué)多才的學(xué)者,亦或是溫柔體貼的知心朋友,小智AI聊天機(jī)器人都能輕松扮演,為用戶帶來(lái)百變的AI 身份體驗(yàn)。
智能交互能力
離線語(yǔ)音喚醒:通過(guò) ESP-SR 實(shí)現(xiàn)。
流式語(yǔ)音對(duì)話:支持 WebSocket 和 UDP 協(xié)議。
聲紋識(shí)別:識(shí)別說(shuō)話者身份。
短期記憶:對(duì)每輪對(duì)話進(jìn)行總結(jié)。
自定義角色:支持提示詞和音色設(shè)置。
LCD 顯示屏:顯示emoji及對(duì)話內(nèi)容。
大模型:可接入DeepSeek、OpenAI 、通義千問(wèn)等
聯(lián)網(wǎng)能力:支持 Wi-Fi 和 4G 雙網(wǎng)絡(luò)接入
3D打印外殼
小智AI聊天機(jī)器人外殼采用3D建模一體成型打印,優(yōu)勢(shì)如下:
簡(jiǎn)易安裝:結(jié)構(gòu)設(shè)計(jì)優(yōu)化,僅需一枚螺絲即可完成組裝,省時(shí)省力。
精致貼合:面板貼合工藝,確保外觀簡(jiǎn)潔流暢,細(xì)節(jié)無(wú)縫銜接。
舒適視角:屏幕窗口設(shè)計(jì)符合人體工程學(xué),提供舒適的桌面可視角度。
麥克風(fēng)隔離:獨(dú)立隔離空間有效提升麥克風(fēng)拾音效果,減少噪音干擾。
穩(wěn)固防護(hù):底部配備防滑腳墊,確保設(shè)備穩(wěn)固放置,同時(shí)防止刮花桌面。
USB-C 接口兼容性:USB-C 口設(shè)計(jì)精確,兼容磁吸和普通連接線,滿足多種使用需求。
小智AI聊天機(jī)器人硬件
小智AI聊天機(jī)器人核心設(shè)計(jì):主控芯片 ESP32-S3-WROOM-1-N16R8 通過(guò) SPI 接口驅(qū)動(dòng) 1.28 寸圓屏,提供 240x240 分辨率的高質(zhì)量顯示。電源管理模塊確保設(shè)備在 5V 輸入下穩(wěn)定運(yùn)行,適合 USB 供電。ES8311 提供高性能音頻處理,支持麥克風(fēng)輸入和揚(yáng)聲器輸出。
供電管理:集成電源管理 IC,確保供電穩(wěn)定,避免電源波動(dòng)導(dǎo)致的設(shè)備異常。
信號(hào)處理:SPI 通信的時(shí)鐘頻率優(yōu)化為 40MHz,確保數(shù)據(jù)傳輸高效無(wú)誤。
小智AI聊天機(jī)器人核心模塊清單如下:
小智AI聊天機(jī)器人電路設(shè)計(jì)
首先經(jīng)過(guò)type-C 輸入的5V電壓,默認(rèn)type-c輸入5V,5V給TP4056給鋰電池充電,同時(shí)鋰電池通過(guò)升壓電路將電壓升到5V,通過(guò)電源轉(zhuǎn)換電路實(shí)現(xiàn)5V輸出,當(dāng)有USB插入時(shí)候,5V電源自動(dòng)切換到USB5V電源路徑,當(dāng)USB電源斷開(kāi)時(shí)候?qū)崿F(xiàn)鋰電池升壓5V輸出,兩路電源切換,在切換時(shí)候整個(gè)系統(tǒng)不會(huì)斷電;5V電壓通過(guò)LDO線性穩(wěn)壓實(shí)現(xiàn)3.3V輸出,3.3V電源分別給主控ESP32、SD卡、數(shù)字麥克風(fēng)和屏幕供電,此外5V還直接給功放和RGB燈供電。
外殼采用防滑紋路設(shè)計(jì),底部有4個(gè)防滑墊片,可以放置與桌面而不出現(xiàn)打滑情況,屏幕鑲嵌與前外殼,美觀而有不會(huì)出現(xiàn)平置出現(xiàn)劃痕,后蓋使用響槍加下螺絲鎖住,螺絲不外露同時(shí)能卡住后外殼,整體簡(jiǎn)潔美觀。
小智AI聊天機(jī)器人硬件源碼?
小智AI聊天機(jī)器人項(xiàng)目源碼:https://github.com/78/xiaozhi-esp32
小智AI聊天機(jī)器人服務(wù)端源碼?
服務(wù)端每個(gè)功能模塊采用獨(dú)立的目錄,便于開(kāi)發(fā)和維護(hù),提高系統(tǒng)的可擴(kuò)展性和可維護(hù)性。
asr-server
+asr-worker
:提供語(yǔ)音活動(dòng)監(jiān)測(cè)、語(yǔ)音轉(zhuǎn)文本、說(shuō)話人識(shí)別等服務(wù);
tts-server
:提供音色管理、音色克隆、語(yǔ)音合成等服務(wù),對(duì)接本地部署的語(yǔ)音模型;
main-server
:主服務(wù),負(fù)責(zé)協(xié)調(diào)語(yǔ)音識(shí)別、大模型、語(yǔ)音合成等各種服務(wù),并對(duì)接后端數(shù)據(jù)庫(kù)。
小智AI聊天機(jī)器人服務(wù)端源碼:https://github.com/xinnan-tech/xiaozhi-esp32-server
如有需求,請(qǐng)加小編微信:? beacon0418