職位描述
職位概述:我們正在尋找一位經(jīng)驗豐富、充滿激情的視覺算法工程師,加入我們的核心研發(fā)團隊。您將負責設(shè)計、開發(fā)和優(yōu)化應(yīng)用于文檔圖像處理和視頻識別分析場景的先進算法,解決實際業(yè)務(wù)挑戰(zhàn),推動技術(shù)創(chuàng)新并實現(xiàn)產(chǎn)品落地。主要方向包括但不限于單證文字識別與信息抽取、視頻圖像檢測,如車輛檢測,人類行為識別,煙火檢測等。工作職責:文檔圖像處理與OCR:負責單證、票據(jù)等圖像的預(yù)處理、版面分析、文字識別(OCR)及關(guān)鍵信息抽取算法的研發(fā)、優(yōu)化與迭代。針對特定類型的單證,能夠獨立或與團隊協(xié)作,完成從算法設(shè)計、模型訓(xùn)練到部署實施的端到端識別抽取解決方案。持續(xù)跟進OCR及相關(guān)領(lǐng)域(如Layout Analysis, Table Recognition, Information Extr****)的前沿技術(shù),以及多模態(tài)視覺大模型的應(yīng)用,提升識別準確率和抽取效率。視頻圖像分析與檢測識別:負責視頻監(jiān)控場景下的目標檢測算法研發(fā),特別是車輛檢測與識別。研發(fā)和優(yōu)化人類行為識別算法,應(yīng)用于異常行為檢測、特定動作分析等場景。研發(fā)和優(yōu)化特定事件檢測算法,如煙火、人群聚集等檢測。探索和應(yīng)用目標跟蹤、視頻分割、視頻理解等相關(guān)技術(shù)。算法研發(fā)與工程化:進行深度學(xué)習(xí)模型的選型、訓(xùn)練、評估與調(diào)優(yōu),確保持續(xù)提升算法性能和魯棒性。負責算法模型的輕量化、性能優(yōu)化及工程化部署,與工程團隊緊密合作,確保算法在實際業(yè)務(wù)系統(tǒng)中的高效穩(wěn)定運行。參與相關(guān)數(shù)據(jù)的采集、標注、清洗與管理工作。任職要求:學(xué)歷與專業(yè):?計算機科學(xué)、人工智能、模式識別、電子工程、數(shù)學(xué)或相關(guān)專業(yè)本科及以上學(xué)歷。理論基礎(chǔ):?具備扎實的計算機視覺、機器學(xué)習(xí)、深度學(xué)習(xí)理論基礎(chǔ)。編程能力:?精通 Python 編程語言,熟練掌握至少一種主流深度學(xué)習(xí)框架(如 TensorFlow, PyTorch, PaddlePaddle 等)。核心經(jīng)驗(滿足以下至少一項):OCR/文檔處理方向:?具備扎實的OCR項目經(jīng)驗,熟悉文字檢測、文字識別、版面分析、關(guān)鍵信息抽?。↘IE)等至少一個環(huán)節(jié)的核心算法和技術(shù)流程。有實際單證識別項目落地經(jīng)驗者優(yōu)先。視頻分析方向:?具備豐富的視頻/圖像處理項目經(jīng)驗,在目標檢測(如YOLO, Faster R-CNN, SSD等)、目標跟蹤、行為識別、圖像分割等領(lǐng)域有深入研究和實踐經(jīng)驗。熟悉車輛檢測、人類行為檢測、特定事件檢測(如煙火)算法者優(yōu)先。綜合能力:具備良好的分析和解決問題的能力,能夠獨立思考并承擔研發(fā)任務(wù)。具備良好的數(shù)據(jù)分析能力和模型調(diào)優(yōu)經(jīng)驗。擁有良好的溝通能力和團隊合作精神,能夠跨團隊協(xié)作。對技術(shù)充滿熱情,具備快速學(xué)習(xí)能力和強烈的責任心。加分項:對特定行業(yè)(如貿(mào)易、物流、金融、制造)的業(yè)務(wù)場景有一定了解者優(yōu)先。
企業(yè)介紹
云鈉科技是專注于人工智能技術(shù)落地化場景應(yīng)用的高科技企業(yè),主要產(chǎn)品包括AI Agent(智能體),魔像RPA和無人機視覺大模型等。公司自成立以來得到了數(shù)百家頭部制造、零售、流通、貿(mào)易等泛供應(yīng)鏈企業(yè)及政府公用事業(yè)客戶的認可。云鈉是上海市專精特新企業(yè)、高新技術(shù)企業(yè)、微軟加速器成員,也是合肥綜合性國家科學(xué)技術(shù)中心孵化企業(yè)。擁有多項自主研發(fā)專利和軟著產(chǎn)品、以及ISO和安全認證,曾獲得第一屆全球科大人創(chuàng)新創(chuàng)業(yè)大賽上海賽區(qū)一等獎。公司由紅杉資本、線性資本、云九資本、昊辰資本等一線機構(gòu)投資。