01
技術面學習

開發環境與版本控管
Spyder:適合影像辨識與模型訓練中的數據處理
VS Code:主要用來撰寫程式碼和debug,同時VS Code 支援 Copilot,可以協助編寫程式,提升開發效率
Git 與 Azure DevOps: 主要進行版本控管,透過 Git 進行版本管理,並使用 commit 記錄每次修改的內容與進度
Anaconda: 方便管理虛擬環境,並且針對專案配置獨立的環境,可以避免不同專案需求的套件衝突問題
影像辨識模型優化
使用YOLO 演算法進行目標檢測與分類,並使⽤ LabelImg和 LabelMe 進⾏標記及前處理。最後進⾏模型的參數調整,
提升影像辨識準確率。
OCR 模型訓練
使⽤ Azure AI 的 Document Intelligence Studio,對貨運單的關鍵欄位進⾏標記與訓練,實現貨運單數據的⾃動提取與結構化處理,提⾼⽂件處理效率。
GPT 模型應用與地端測試
以軟體需求規格書為根據,針對 GPT 模型進⾏參數調整、模型微調,並進⾏優化,幫助模型更準確地回答,最後達到 95%以上的準確率。
此外,透過 Postman 測試地端模型的 API 串接,確保數據正確性及 QA 功能是否符合預期
即時語音識別、摘要與多語下載
結合 Azure Speech Service,將語⾳即時轉換為⽂字,並⽀持多語⾔識別,滿⾜不同語⾔⽤⼾的需求。同時利⽤Azure OpenAI 對累積⽂本進⾏翻譯與摘要⽣成,確保多語⾔的準確翻譯和簡潔摘要。
最終,透過 Azure Static Web 發佈網站,提供⽤⼾便捷的即時語⾳轉⽂字、多語⾔翻譯及摘要服務,並支援逐字稿與摘要的多語言下載。
模型部署與操作界⾯設計
利⽤ Ollama 將 GPT 模型部署到伺服器,並整合 Open
Web UI,提供直觀的操作界⾯以展⽰模型功能。提升⽤⼾交互體驗,並作為專案的測試與demo樣本

.png)