AI 教室智慧監視系統實作

學號: 1121410003 | 姓名: 施柏辰

(1) AI_YOLO 教室智慧監視系統製作

本專案旨在結合樹莓派（Raspberry Pi）與影像辨識技術，打造一套能夠即時串流、偵測人臉、手部及物件的智慧教室監視系統。

(2) 資訊專案結構 (說明)

本專案採用 Python 搭配 Flask 框架建立 Web 伺服器，並使用 MediaPipe 與 OpenCV 進行邊緣端的 AI 影像運算。以下為專案的主要目錄結構：

my_ai_surveillance/
│
├── app.py                 # Flask 主程式，負責網頁路由與串流
├── templates/
│   └── index.html         # 前端顯示介面
├── static/
│   ├── css/               # 網頁樣式表
│   └── js/                # 前端 JavaScript 腳本
└── models/                # 存放 YOLO 或 AI 權重模型

(3) 資訊系統環境圖 (UML) 與程式邏輯說明

系統環境圖

程式邏輯說明

影像擷取：透過 OpenCV 的 cv2.VideoCapture() 讀取 USB Web Camera 的即時影像訊號。
AI 影像處理：將每幀（Frame）傳入 MediaPipe 或 YOLO 模組進行座標與物件計算。
即時串流：透過 Flask 伺服器的 Response(gen_frames(), mimetype='multipart/x-mixed-replace; boundary=frame') 機制，將處理後的影像傳回前端網頁。

(4) 功能測試一: Web Camera

測試樹莓派透過 fswebcam 或 OpenCV 能否正常抓取到硬體視訊鏡頭畫面。

圖：教室區域網頁影像串流畫面實測

(5) 功能測試三: 手部偵測 (MediaPipe)

利用 MediaPipe Hands 解決方案，即時抓取畫面中手部的 21 個關鍵點（Landmarks）。

圖：MediaPipe Hand 骨架節點即時串流畫面

(6) 功能測試四: 臉部網格偵測

利用 MediaPipe Face Mesh，在臉部投射出 468 個 3D 座標點，以進行精細的臉部特徵捕捉。

圖：臉部 468 節點網格 Active 偵測結果

(7) 全系統功能整合

整合後的完整智慧監視系統功能包含：

即時影像串流 透過區域網路傳輸即時無延遲畫面。

物件資訊顯示框 動態繪製 YOLO 邊界框（Bounding Box）。

事件時間軸 紀錄異常或特定偵測發生的時間點。

事件標示 在畫面上自動給予事件類別標籤與信心度。

計數功能進階 自動計算教室內的人數或物品數量。

(8) Trouble Shooting 與學習心得

踩坑與解決紀錄 (Trouble Shooting)

問題一：在 Windows 終端機使用 SSH 連線樹莓派時，出現 Connection refused。
解決：確認樹莓派端的 SSH 服務是否有開啟，並檢查兩台設備是否連在同一個 IP 網段內。
問題二：執行 Python 程式時，終端機回報找不到模組（ModuleNotFoundError）。
解決：使用 pip install 正確安裝 mediapipe 與 opencv-python。

學習心得

透過本次專案，我學會了如何使用樹莓派進行 Linux 系統的環境佈署，並掌握了利用 ARP 指令與 IP 搜尋來找到設備。最大的收穫在於將平常在電腦上運行的 AI 視覺模型成功移植到輕量級的嵌入式系統上，並順利實現了 Web 端影像即時串流，這對未來開發物聯網與邊緣運算（Edge AI）奠定了厚實的基礎。