大家好,我是雜燴君。
今天要給大家介紹的,是一個充滿趣味與挑戰(zhàn)的開源項目 —— 小智 AI 聊天機器人。
一、小智簡介
小智 AI 聊天機器人是蝦哥開發(fā)的開源項目,以 MIT 許可證發(fā)布:https://github.com/78/xiaozhi-esp32
這個項目旨在幫助更多人踏入 AI 硬件開發(fā)的大門,讓我們了解如何將當(dāng)下熱門的大語言模型應(yīng)用到實際硬件設(shè)備中。
面包板效果:
已經(jīng)支持的開源硬件:
- 立創(chuàng)·實戰(zhàn)派 ESP32-S3 開發(fā)板樂鑫 ESP32-S3-BOX3M5Stack CoreS3AtomS3R + Echo BaseAtomMatrix + Echo Base神奇按鈕 2.4微雪電子 ESP32-S3-Touch-AMOLED-1.8LILYGO T-Circle-S3蝦哥 Mini C3Moji 小智AI衍生版璀璨·AI吊墜無名科技Nologo-星智-1.54TFT無名科技Nologo-星智-0.96TFTSenseCAP Watcher
二、小智已實現(xiàn)功能
多樣聯(lián)網(wǎng)方式:支持 Wi-Fi 和 ML307 Cat.1 4G 聯(lián)網(wǎng)。
便捷喚醒與打斷:BOOT 鍵喚醒和打斷,支持點擊和長按兩種觸發(fā)方式,還具備離線語音喚醒 ESP - SR 功能,操作簡單又高效,能實時打斷對話,就像和真人聊天一樣自然。
強大的語音交互:實現(xiàn)流式語音對話,支持國語、粵語、英語、日語、韓語 5 種語言識別。
優(yōu)質(zhì)大模型加持:集成了大模型 TTS(火山引擎或 CosyVoice)和大模型 LLM(Qwen, DeepSeek, Doubao),擁有可配置的提示詞和音色,還具備短期記憶功能,每輪對話后能自我總結(jié),讓對話更加連貫和智能。
豐富的顯示功能:OLED/LCD 顯示屏不僅能顯示信號強弱,還能展示對話內(nèi)容,甚至支持 LCD 顯示圖片表情,為你的聊天增添更多樂趣。
三、硬件支持
項目支持多種開源硬件,從立創(chuàng)?實戰(zhàn)派 ESP32 - S3 開發(fā)板,到樂鑫 ESP32 - S3 - BOX3、M5Stack CoreS3 等,滿足不同開發(fā)者的需求。
而且,它還支持面包板手工制作,對于想要親手實踐的朋友來說,是個絕佳的機會。
詳細(xì)教程可在飛書文檔《小智 AI 聊天機器人百科全書》中查看,即使是硬件小白,也能輕松上手。
https://ccnphfhqs21z.feishu.cn/wiki/F5krwD16viZoF0kKkvDcrZNYnhb
四、開發(fā)環(huán)境與智能體配置
- Cursor 或 VSCode安裝 ESP-IDF 插件,選擇 SDK 版本 5.3 或以上Linux 比 Windows 更好,編譯速度快,也免去驅(qū)動問題的困擾使用 Google C++ 代碼風(fēng)格,提交代碼時請確保符合規(guī)范
如果我們已經(jīng)擁有一個小智 AI 聊天機器人設(shè)備,可以登錄?xiaozhi.me?控制臺進行配置。
同時,項目還提供了詳細(xì)的 WebSocket 通信協(xié)議文檔,對于想要在個人電腦上部署服務(wù)器的朋友,可以參考:
https://github.com/78/xiaozhi-esp32/blob/main/docs/websocket.md
五、Linux版本小智
百問網(wǎng)團隊最近也在嵌入式Linux平臺上進行適配,項目鏈接:https://github.com/100askTeam/xiaozhi-linux
已支持硬件列表:
- 100ASK_T113s3-PRO Tina4系統(tǒng) :?100ASK_T113s3-Pro_Tina4100ASK_T113s3-PRO Tina5系統(tǒng):?100ASK-T113s3-Pro_Tina5DongshanPI-AICT Tina4系統(tǒng) :?DongshanPI-AICT100ASK_IMX6ULL-PRO Buildroot20系統(tǒng) :?100ASK_IMX6ULL-PRO
感興趣的朋友可以去玩一玩。無論是從學(xué)習(xí)技術(shù),還是從享受趣味科技的角度來看,都非常值得一試。