亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

小語(yǔ)種OCR標(biāo)注效率提升10+倍:PaddleOCR+ERNIE 4.5自動(dòng)標(biāo)注實(shí)戰(zhàn)解析

jf_23871869 ? 來(lái)源:jf_23871869 ? 作者:jf_23871869 ? 2025-08-29 11:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要 :小語(yǔ)種OCR研發(fā)的核心瓶頸在于高質(zhì)量標(biāo)注數(shù)據(jù)的稀缺與高昂成本。本文介紹一種創(chuàng)新的自動(dòng)化標(biāo)注方案,利用 PaddleOCR 進(jìn)行文本檢測(cè)與裁剪,并調(diào)用 ERNIE 4.5 大模型進(jìn)行雙重預(yù)測(cè)與一致性校驗(yàn),實(shí)現(xiàn)高精度、低成本的小語(yǔ)種OCR訓(xùn)練數(shù)據(jù)生成。該方案將數(shù)據(jù)準(zhǔn)備周期 從數(shù)周縮短至數(shù)小時(shí) ,為小語(yǔ)種模型的快速迭代與冷啟動(dòng)提供了全新范式

一、引言:小語(yǔ)種OCR的“數(shù)據(jù)之困”

在跨境支付、多語(yǔ)言文檔處理、全球化應(yīng)用本地化等場(chǎng)景中,小語(yǔ)種(如俄語(yǔ)、泰語(yǔ)、阿拉伯語(yǔ)等)的文本識(shí)別需求日益增長(zhǎng)。然而,研發(fā)高性能的小語(yǔ)種OCR模型面臨嚴(yán)峻挑戰(zhàn):

  • 數(shù)據(jù)極度稀缺 :公開的小語(yǔ)種標(biāo)注數(shù)據(jù)集數(shù)量遠(yuǎn)不及英語(yǔ)等主流語(yǔ)種,難以支撐深度模型訓(xùn)練。
  • 標(biāo)注成本高昂 :依賴精通小語(yǔ)種的專業(yè)人員進(jìn)行人工標(biāo)注,成本極高(大概$120/千字符),且效率低下。
  • 質(zhì)量難以保證 :不同標(biāo)注員的主觀判斷和疲勞度導(dǎo)致標(biāo)簽一致性差,影響模型最終性能。
  • 研發(fā)周期漫長(zhǎng) :從數(shù)據(jù)收集、標(biāo)注、清洗到模型訓(xùn)練的完整周期動(dòng)輒數(shù)周,嚴(yán)重拖慢產(chǎn)品迭代。

為破解這一困局,我們提出一種**“AI標(biāo)注AI”** 的創(chuàng)新思路:利用大語(yǔ)言模型(LLM)強(qiáng)大的多語(yǔ)言理解與OCR能力,自動(dòng)化生成高質(zhì)量的訓(xùn)練標(biāo)簽。本文將詳細(xì)介紹如何結(jié)合 PaddleOCR 的精準(zhǔn)文本檢測(cè)能力與 ERNIE 4.5 的語(yǔ)義識(shí)別能力,構(gòu)建一套高效、可靠的自動(dòng)化標(biāo)注流水線。


二、技術(shù)方案:PaddleOCR + ERNIE 4.5 的協(xié)同工作流

我們的解決方案將小語(yǔ)種OCR數(shù)據(jù)標(biāo)注流程解耦為兩個(gè)核心階段,充分發(fā)揮各自技術(shù)的優(yōu)勢(shì)。

2.1 整體流程設(shè)計(jì)

整個(gè)自動(dòng)化標(biāo)注流程如下圖所示,共分為四步:

  1. 圖像采集 :收集包含目標(biāo)小語(yǔ)種(如俄語(yǔ))文本的原始圖像。
  2. 文本檢測(cè)與裁剪 :使用 PaddleOCR 的 PP-OCRv5 檢測(cè)模型,定位圖像中的所有文本行,并將其裁剪為獨(dú)立的文本行圖像。
  3. 大模型雙重識(shí)別 :將每一張裁剪出的文本行圖像,通過(guò) API 調(diào)用 ERNIE 4.5 進(jìn)行兩次獨(dú)立的文字識(shí)別。
  4. 一致性校驗(yàn) :僅當(dāng)兩次識(shí)別結(jié)果完全一致時(shí),才將其作為最終的可靠標(biāo)簽。若結(jié)果不一致,則該樣本被標(biāo)記為“待復(fù)核”或丟棄。

自動(dòng)化標(biāo)注流程圖

核心優(yōu)勢(shì)

  • 成本極低 :大幅減少甚至消除人工標(biāo)注成本。
  • 一致性高 :大模型的輸出穩(wěn)定,避免了人工標(biāo)注的主觀波動(dòng)。
  • 效率飛躍 :可實(shí)現(xiàn)批量化、自動(dòng)化處理,速度提升數(shù)十倍。
  • 質(zhì)量可控 :通過(guò)雙重校驗(yàn)機(jī)制,有效過(guò)濾大模型的“幻覺(jué)”(hallucination)問(wèn)題。

三、環(huán)境準(zhǔn)備與依賴安裝

本項(xiàng)目依賴 PaddlePaddle、PaddleOCR,OpenAI SDK 及常用 Python 工具包。使用前請(qǐng)確保已安裝相關(guān)依賴。詳細(xì)安裝指南見(jiàn)環(huán)境準(zhǔn)備文檔:

# 創(chuàng)建并激活虛擬環(huán)境 (推薦)
python -m venv ocr-env
source ocr-env/bin/activate  # Linux/Mac
# ocr-envScriptsactivate   # Windows

# 安裝核心庫(kù)
pip install paddlepaddle-gpu  # 或 paddlepaddle (CPU版本)
pip install paddleocr
pip install openai  # 用于調(diào)用ERNIE 4.5 API
pip install matplotlib tqdm opencv-python

注意openai SDK 可用于調(diào)用兼容 OpenAI API 格式的 ERNIE Bot 服務(wù)。您需要配置 base_url 指向您的 ERNIE 4.5 API 服務(wù)地址。


四、核心實(shí)現(xiàn):代碼詳解

4.1 文本檢測(cè)與裁剪

首先,使用 PaddleOCR 的 PP-OCRv5 檢測(cè)模型定位并裁剪文本行。針對(duì)小語(yǔ)種(如西里爾字母)的特點(diǎn),我們對(duì)檢測(cè)參數(shù)進(jìn)行了優(yōu)化。

import base64
import copy
import glob
import os
import time

import cv2
import numpy as np
from openai import OpenAI
from tqdm import tqdm


def get_rotate_crop_image(img: np.ndarray, points: list) - > np.ndarray:
    """
    裁剪并旋轉(zhuǎn)圖片區(qū)域,得到透視變換后的文本行小圖。
    """
    assert len(points) == 4, "shape of points must be 4*2"
    img_crop_width = int(
        max(
            np.linalg.norm(points[0] - points[1]),
            np.linalg.norm(points[2] - points[3]),
        )
    )
    img_crop_height = int(
        max(
            np.linalg.norm(points[0] - points[3]),
            np.linalg.norm(points[1] - points[2]),
        )
    )
    pts_std = np.float32(
        [
            [0, 0],
            [img_crop_width, 0],
            [img_crop_width, img_crop_height],
            [0, img_crop_height],
        ]
    )
    M = cv2.getPerspectiveTransform(points, pts_std)
    dst_img = cv2.warpPerspective(
        img,
        M,
        (img_crop_width, img_crop_height),
        borderMode=cv2.BORDER_REPLICATE,
        flags=cv2.INTER_CUBIC,
    )
    dst_img_height, dst_img_width = dst_img.shape[0:2]
    if dst_img_height * 1.0 / dst_img_width >= 1.5:
        dst_img = np.rot90(dst_img)
    return dst_img


def get_minarea_rect_crop(img: np.ndarray, points: np.ndarray) - > np.ndarray:
    """
    從檢測(cè)點(diǎn)集裁出最小面積矩形區(qū)域。
    """
    bounding_box = cv2.minAreaRect(np.array(points).astype(np.int32))
    points = sorted(cv2.boxPoints(bounding_box), key=lambda x: x[0])
    index_a, index_b, index_c, index_d = 0, 1, 2, 3
    if points[1][1] > points[0][1]:
        index_a = 0
        index_d = 1
    else:
        index_a = 1
        index_d = 0
    if points[3][1] > points[2][1]:
        index_b = 2
        index_c = 3
    else:
        index_b = 3
        index_c = 2

    box = [points[index_a], points[index_b], points[index_c], points[index_d]]
    crop_img = get_rotate_crop_image(img, np.array(box))
    return crop_img


def crop_and_save(image_path, output_dir, ocr):
    """
    檢測(cè)并裁剪圖片中的所有文本行,保存到output_dir
    """
    img = cv2.imread(image_path)
    img_name = os.path.splitext(os.path.basename(image_path))[0]
    result = ocr.predict(image_path)
    try:
        for res in result:
            cnt = 0
            for quad_box in res['dt_polys']:
                img_crop = get_minarea_rect_crop(res['input_img'], copy.deepcopy(quad_box))
                cv2.imwrite(os.path.join(output_dir, f"{img_name}_crop{cnt:04d}.jpg"), img_crop)
                cnt += 1

    except Exception as e:
        print(f"Process Failed with error: {e}")


# 用法舉例(假如你的圖片都在 russian_dataset_demo/ 目錄下)
input_dir = 'russian_dataset_demo'
output_dir = 'crops'  # 裁剪后的圖片保存到這個(gè)目錄
os.makedirs(output_dir, exist_ok=True)

image_paths = glob.glob(os.path.join(input_dir, '*.jpg')) + glob.glob(os.path.join(input_dir, '*.png'))

# 批量處理
from paddleocr import TextDetection

ocr = TextDetection(
    model_name="PP-OCRv5_server_det",
    device='gpu',
)
for path in tqdm(image_paths):
    crop_and_save(path, output_dir, ocr)
print(f"裁剪完成,保存到 {output_dir} 目錄")

4.2 ERNIE 4.5 自動(dòng)標(biāo)注(雙重校驗(yàn))

這是方案的核心。我們調(diào)用 ERNIE 4.5 對(duì)每張裁剪后的文本行圖像進(jìn)行兩次獨(dú)立識(shí)別,并校驗(yàn)結(jié)果一致性。

from openai import OpenAI
import base64
import json

# 配置ERNIE 4.5 API
client = OpenAI(
    base_url="http://your-ernie-api-server:8866/v1",  # 替換為實(shí)際地址
    api_key="your_api_key"  # 替換為實(shí)際密鑰
)

def encode_image(image_path):
    """將圖像編碼為base64字符串"""
    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode('utf-8')

def auto_label_single_image(image_path):
    """對(duì)單張文本行圖像進(jìn)行雙重識(shí)別"""
    base64_image = encode_image(image_path)
    prompt = "請(qǐng)識(shí)別圖像中的文字內(nèi)容,僅輸出原始文本,不要任何解釋、翻譯或標(biāo)點(diǎn)。"

    try:
        # 第一次預(yù)測(cè)(標(biāo)準(zhǔn)模式)
        response1 = client.chat.completions.create(
            model="ernie-bot-4.5",
            messages=[
                {
                    "role": "user",
                    "content": [
                        {"type": "text", "text": prompt},
                        {
                            "type": "image_url",
                            "image_url": {
                                "url": f"image/jpeg;base64,{base64_image}"
                            }
                        }
                    ]
                }
            ],
            max_tokens=50
        )
        text1 = response1.choices[0].message.content.strip()

        # 第二次預(yù)測(cè)(嚴(yán)格模式,增強(qiáng)魯棒性)
        strict_prompt = "Only output the raw text in the image. No explanation, no translation."
        response2 = client.chat.completions.create(
            model="ernie-bot-4.5",
            messages=[
                {
                    "role": "user",
                    "content": [
                        {"type": "text", "text": strict_prompt},
                        {
                            "type": "image_url",
                            "image_url": {
                                "url": f"image/jpeg;base64,{base64_image}"
                            }
                        }
                    ]
                }
            ],
            max_tokens=50
        )
        text2 = response2.choices[0].message.content.strip()

        # 一致性校驗(yàn):結(jié)果必須完全一致且非空
        if text1 and text2 and text1 == text2 and text1 != "###":
            return {
                "image_path": os.path.basename(image_path),
                "label": text1,
                "source": "ernie_4.5_auto",
                "confidence": 1.0  # 完全一致,置信度為1
            }
        else:
            # 結(jié)果不一致、為空或?yàn)檎嘉环祷豊one
            return None
            
    except Exception as e:
        print(f"API調(diào)用失敗 {image_path}: {e}")
        return None

# 批量處理所有裁剪后的圖像
cropped_dir = "cropped_text_lines"
output_label_file = "auto_labeled_data.txt"

with open(output_label_file, 'w', encoding='utf-8') as f:
    for crop_file in tqdm(os.listdir(cropped_dir), desc="ERNIE 4.5 自動(dòng)標(biāo)注"):
        if crop_file.lower().endswith(('.jpg', '.jpeg', '.png')):
            crop_path = os.path.join(cropped_dir, crop_file)
            result = auto_label_single_image(crop_path)
            if result:
                # 寫入標(biāo)準(zhǔn)的OCR訓(xùn)練格式: relative_pathtlabel
                f.write(f"{crop_file}t{result['label']}n")
                print(f"標(biāo)注成功: {crop_file} - > {result['label']}")

五、模型訓(xùn)練與評(píng)估

5.1 使用生成數(shù)據(jù)訓(xùn)練OCR模型

將通過(guò)自動(dòng)化流程生成的 auto_labeled_data.txt 文件作為訓(xùn)練集,利用 PaddleOCR 的訓(xùn)練腳本對(duì)小語(yǔ)種(如俄語(yǔ))文本識(shí)別模型進(jìn)行訓(xùn)練。

python PaddleOCR/tools/train.py 
    -c configs/rec/PP-OCRv5/multi_language/ru_PP-OCRv5_mobile_rec.yml 
    -o Global.train_batch_size_per_card=64 
       Global.epoch_num=200 
       Global.lr=0.001 
       Global.print_batch_step=10

建議: 在訓(xùn)練前,人工抽檢100-200個(gè)自動(dòng)生成的標(biāo)簽,驗(yàn)證其準(zhǔn)確率。將抽檢出的錯(cuò)誤樣本從訓(xùn)練集中剔除,或進(jìn)行人工修正。

5.2 模型導(dǎo)出與部署

訓(xùn)練完成后,需要將訓(xùn)練好的模型從動(dòng)態(tài)圖(.pdparams)轉(zhuǎn)換為靜態(tài)圖格式,以便于在生產(chǎn)環(huán)境中進(jìn)行高性能推理。

python PaddleOCR/tools/export_model.py 
    -c configs/rec/PP-OCRv5/multi_language/ru_PP-OCRv5_mobile_rec.yml 
    -o Global.save_inference_dir=./inference/rec_ru

模型導(dǎo)出后,可以將其部署到服務(wù)器或移動(dòng)端,用于實(shí)時(shí)OCR識(shí)別。

!paddleocr text_recognition -i https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/demo_images/labeled_test.jpg --model_name eslav_PP-OCRv5_mobile_rec --model_dir ./inference/rec_ru/

推理結(jié)果如下所示:

六、效果分析與總結(jié)

6.1 性能對(duì)比

在1000張俄語(yǔ)商品圖片上進(jìn)行俄語(yǔ)標(biāo)注,本方案與傳統(tǒng)人工標(biāo)注對(duì)比顯著:

指標(biāo)人工標(biāo)注本方案(PaddleOCR+ERNIE 4.5)提升/優(yōu)勢(shì)
單張?zhí)幚頃r(shí)間4.5分鐘12秒提升22.5倍
字符準(zhǔn)確率 (CACC)92.1%96.3%↑ 4.2%
特殊符號(hào)正確率78.5%93.7%↑ 15.2%
綜合成本極高極低(主要是API調(diào)用費(fèi))成本降低95%+

說(shuō)明 :AI方案的字符準(zhǔn)確率達(dá)到96.3%,這得益于雙重校驗(yàn)機(jī)制。但在實(shí)際應(yīng)用中,建議開發(fā)者在自己的數(shù)據(jù)集上進(jìn)行驗(yàn)證。

6.2 總結(jié)與展望

本文提出的基于 PaddleOCR + ERNIE 4.5 的自動(dòng)化標(biāo)注方案,成功地將大模型的“智能”注入到傳統(tǒng)OCR的數(shù)據(jù)準(zhǔn)備環(huán)節(jié),實(shí)現(xiàn)了:

  • 范式創(chuàng)新 :從“人喂數(shù)據(jù)”到“AI自產(chǎn)數(shù)據(jù)”,重塑了OCR研發(fā)流程。
  • 效率革命 :將數(shù)周的標(biāo)注周期壓縮至數(shù)小時(shí),極大加速了模型迭代。
  • 成本突破 :幾乎消除了人工標(biāo)注成本,使小語(yǔ)種OCR研發(fā)變得經(jīng)濟(jì)可行。

附錄

結(jié)語(yǔ) :在大模型時(shí)代,AI的研發(fā)方式正在發(fā)生根本性變革。利用大模型作為“智能代理”來(lái)自動(dòng)化處理傳統(tǒng)AI研發(fā)中的繁瑣任務(wù),將是提升研發(fā)效率、降低技術(shù)門檻的關(guān)鍵。本方案為小語(yǔ)種OCR乃至更廣泛的多模態(tài)任務(wù),提供了一個(gè)極具啟發(fā)性的實(shí)踐范例。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    170

    瀏覽量

    17005
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3375

    瀏覽量

    4833
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    CAD標(biāo)注關(guān)聯(lián)的作用解析

      在浩辰CAD軟件中標(biāo)注關(guān)聯(lián)就是標(biāo)注跟圖形相關(guān)連,例如你捕捉一條直線的兩個(gè)端點(diǎn)進(jìn)行標(biāo)注,當(dāng)你拖動(dòng)直線的夾點(diǎn)改變直線的長(zhǎng)度時(shí),標(biāo)注會(huì)自動(dòng)跟隨
    發(fā)表于 05-19 15:14

    CAD中怎么自動(dòng)標(biāo)注設(shè)備?

    本帖最后由 dilino 于 2021-2-23 16:26 編輯 在使用國(guó)產(chǎn)CAD軟件繪制電氣圖紙的過(guò)程中,如果想要對(duì)設(shè)備進(jìn)行自動(dòng)標(biāo)注的話CAD怎么標(biāo)注尺寸呢?下面就讓小編來(lái)給大家介紹一下
    發(fā)表于 02-23 16:24

    基于圖像自動(dòng)標(biāo)注技術(shù)研究

    現(xiàn)有圖像自動(dòng)標(biāo)注技術(shù)算法可以大致劃分為基于語(yǔ)義的標(biāo)注算法、基于矩陣分解的標(biāo)注算法、基于概率的標(biāo)注算法以及基于圖學(xué)習(xí)的
    發(fā)表于 12-14 11:46 ?2次下載

    基于SAE的自動(dòng)圖像標(biāo)注算法

    自動(dòng)編碼器(stacked auto-encoder,簡(jiǎn)稱SAE)的自動(dòng)圖像標(biāo)注算法。提升標(biāo)注效率
    發(fā)表于 12-28 10:59 ?0次下載
    基于SAE的<b class='flag-5'>自動(dòng)</b>圖像<b class='flag-5'>標(biāo)注</b>算法

    多倫多大學(xué)&NVIDIA最新成果 圖像標(biāo)注速度提升10

    Curve-GCN是一種高效交互式圖像標(biāo)注方法,其性能優(yōu)于Polygon-RNN++。在自動(dòng)模式下運(yùn)行時(shí)間為29.3ms,在交互模式下運(yùn)行時(shí)間為2.6ms,比Polygon-RNN ++分別快10
    的頭像 發(fā)表于 05-05 09:51 ?2796次閱讀

    什么是數(shù)據(jù)標(biāo)注?數(shù)據(jù)如何標(biāo)注?

    標(biāo)注的數(shù)據(jù)突出顯示某些特征,并根據(jù)這些特征對(duì)其進(jìn)行分類,可以通過(guò)模型分析其模式以預(yù)測(cè)新的目標(biāo)。例如,對(duì)于自動(dòng)駕駛汽車中的計(jì)算機(jī)視覺(jué),AI專業(yè)人員或數(shù)據(jù)標(biāo)注者可以使用視頻標(biāo)注工具來(lái)指示路
    的頭像 發(fā)表于 07-17 09:39 ?5.2w次閱讀

    點(diǎn)云標(biāo)注簡(jiǎn)介及其應(yīng)用

    個(gè)分支。 點(diǎn)云標(biāo)注技術(shù)主要分為手工標(biāo)注自動(dòng)標(biāo)注兩種方式。手工標(biāo)注是指通過(guò)人工的方式對(duì)點(diǎn)云數(shù)據(jù)進(jìn)行逐一標(biāo)
    的頭像 發(fā)表于 05-26 17:53 ?1.1w次閱讀

    點(diǎn)云標(biāo)注的算法優(yōu)化與性能提升

    點(diǎn)云標(biāo)注的算法優(yōu)化和性能提升是提高自動(dòng)駕駛技術(shù)的關(guān)鍵因素。通過(guò)優(yōu)化算法和提升性能,可以獲得更準(zhǔn)確、更高效的點(diǎn)云標(biāo)注結(jié)果。 首先,算法優(yōu)化可以
    的頭像 發(fā)表于 07-13 15:20 ?1137次閱讀

    圖像標(biāo)注如何提升效率?

    心煩意亂,還會(huì)耗費(fèi)大量時(shí)間。這時(shí)候,我們就需要借助標(biāo)注工具,來(lái)幫助我們提高標(biāo)注效率。那么市面上有沒(méi)有類似的工具呢?答案是有的!但一些工具費(fèi)用昂貴,對(duì)使用者的能力要
    的頭像 發(fā)表于 12-19 08:29 ?827次閱讀
    圖像<b class='flag-5'>標(biāo)注</b>如何<b class='flag-5'>提升</b><b class='flag-5'>效率</b>?

    自動(dòng)標(biāo)注技術(shù)推動(dòng)AI數(shù)據(jù)訓(xùn)練革新

    結(jié)果的高準(zhǔn)確率,相對(duì)純?nèi)斯?b class='flag-5'>標(biāo)注效率提升70%以上,為用戶提供更性價(jià)比的數(shù)據(jù)方案和服務(wù)。本文將就自動(dòng)標(biāo)注平臺(tái)是什么以及為AI數(shù)據(jù)訓(xùn)練帶來(lái)哪
    的頭像 發(fā)表于 03-14 16:46 ?985次閱讀

    標(biāo)貝自動(dòng)化數(shù)據(jù)標(biāo)注平臺(tái)推動(dòng)AI數(shù)據(jù)訓(xùn)練革新

    結(jié)果的高準(zhǔn)確率,相對(duì)純?nèi)斯?b class='flag-5'>標(biāo)注效率提升70%以上,為用戶提供更性價(jià)比的數(shù)據(jù)方案和服務(wù)。本文將就自動(dòng)標(biāo)注平臺(tái)是什么以及為AI數(shù)據(jù)訓(xùn)練帶來(lái)哪
    的頭像 發(fā)表于 03-14 16:42 ?1209次閱讀
    標(biāo)貝<b class='flag-5'>自動(dòng)</b>化數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>平臺(tái)推動(dòng)AI數(shù)據(jù)訓(xùn)練革新

    大模型預(yù)標(biāo)注自動(dòng)標(biāo)注OCR標(biāo)注場(chǎng)景的應(yīng)用

    OCR,即光學(xué)字符識(shí)別,簡(jiǎn)單來(lái)說(shuō)就是利用光學(xué)設(shè)備去捕獲圖像并識(shí)別文字,最終將圖片中的文字轉(zhuǎn)換為可編輯和可搜索的文本。在數(shù)字化時(shí)代,OCR(光學(xué)字符識(shí)別)技術(shù)作為處理圖像中文字信息的關(guān)鍵手段,其標(biāo)注
    的頭像 發(fā)表于 04-15 15:18 ?644次閱讀

    數(shù)據(jù)標(biāo)注與大模型的雙向賦能:效率與性能的躍升

    自動(dòng)化能力,反過(guò)來(lái)推動(dòng)數(shù)據(jù)標(biāo)注效率實(shí)現(xiàn)數(shù)倍增長(zhǎng),開啟人工智能發(fā)展的全新篇章。一、數(shù)據(jù)標(biāo)注大模型性能的基石大模型的性能高度依賴于訓(xùn)練數(shù)據(jù)的質(zhì)量與規(guī)模,而數(shù)據(jù)
    的頭像 發(fā)表于 06-04 17:15 ?1446次閱讀
    數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>與大模型的雙向賦能:<b class='flag-5'>效率</b>與性能的躍升

    什么是自動(dòng)駕駛數(shù)據(jù)標(biāo)注?如何好做數(shù)據(jù)標(biāo)注?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛系統(tǒng)的開發(fā)過(guò)程中,數(shù)據(jù)標(biāo)注是一項(xiàng)至關(guān)重要的工作。它不僅決定了模型訓(xùn)練的質(zhì)量,也直接影響了車輛感知、決策與控制的性能表現(xiàn)。隨著傳感器種類和數(shù)據(jù)量的劇增,有效
    的頭像 發(fā)表于 07-09 09:19 ?773次閱讀
    什么是<b class='flag-5'>自動(dòng)</b>駕駛數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>?如何好做數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>?

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注主要是標(biāo)注什么?

    的結(jié)構(gòu)化標(biāo)簽。這些標(biāo)簽不僅構(gòu)成了模型訓(xùn)練與評(píng)估的數(shù)據(jù)基礎(chǔ),也直接影響系統(tǒng)在實(shí)際道路環(huán)境中的識(shí)別、理解和決策能力。準(zhǔn)確、系統(tǒng)的數(shù)據(jù)標(biāo)注能夠有效提升感知算法的魯棒性與泛化能力,因此數(shù)據(jù)標(biāo)注在整個(gè)
    的頭像 發(fā)表于 07-30 11:54 ?694次閱讀
    <b class='flag-5'>自動(dòng)</b>駕駛數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>主要是<b class='flag-5'>標(biāo)注</b>什么?