本專案旨在結合樹莓派(Raspberry Pi)與影像辨識技術,打造一套能夠即時串流、偵測人臉、手部及物件的智慧教室監視系統。
本專案採用 Python 搭配 Flask 框架建立 Web 伺服器,並使用 MediaPipe 與 OpenCV 進行邊緣端的 AI 影像運算。以下為專案的主要目錄結構:
my_ai_surveillance/
│
├── app.py # Flask 主程式,負責網頁路由與串流
├── templates/
│ └── index.html # 前端顯示介面
├── static/
│ ├── css/ # 網頁樣式表
│ └── js/ # 前端 JavaScript 腳本
└── models/ # 存放 YOLO 或 AI 權重模型
cv2.VideoCapture() 讀取 USB Web Camera 的即時影像訊號。Response(gen_frames(), mimetype='multipart/x-mixed-replace; boundary=frame') 機制,將處理後的影像傳回前端網頁。測試樹莓派透過 fswebcam 或 OpenCV 能否正常抓取到硬體視訊鏡頭畫面。
圖:教室區域網頁影像串流畫面實測
利用 MediaPipe Hands 解決方案,即時抓取畫面中手部的 21 個關鍵點(Landmarks)。
圖:MediaPipe Hand 骨架節點即時串流畫面
利用 MediaPipe Face Mesh,在臉部投射出 468 個 3D 座標點,以進行精細的臉部特徵捕捉。
圖:臉部 468 節點網格 Active 偵測結果
整合後的完整智慧監視系統功能包含:
Connection refused。pip install 正確安裝 mediapipe 與 opencv-python。透過本次專案,我學會了如何使用樹莓派進行 Linux 系統的環境佈署,並掌握了利用 ARP 指令與 IP 搜尋來找到設備。最大的收穫在於將平常在電腦上運行的 AI 視覺模型成功移植到輕量級的嵌入式系統上,並順利實現了 Web 端影像即時串流,這對未來開發物聯網與邊緣運算(Edge AI)奠定了厚實的基礎。