您的位置:首頁 > 軟件教程 > 教程 > 使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

來源:好特整理 | 時間:2024-06-20 11:49:05 | 閱讀:183 |  標(biāo)簽: T cat | El S C   | 分享到:

目錄安裝運行 doccano打開 doccanno創(chuàng)建項目上傳數(shù)據(jù)定義標(biāo)簽添加成員開始標(biāo)注導(dǎo)出數(shù)據(jù)查看數(shù)據(jù)統(tǒng)計 數(shù)據(jù)標(biāo)注工具 Label-Studio 安裝 打開命令行(cmd、terminal)執(zhí)行安裝命令 # Python 3.8+ pip install doccano -i https://

數(shù)據(jù)標(biāo)注工具 Label-Studio

Label-Studio是一個用于數(shù)據(jù)標(biāo)注的工具。它提供了一個簡單易用的界面,可以幫助用戶進(jìn)行各種類型的數(shù)據(jù)標(biāo)注工作,如文本分類、命名實體識別、關(guān)系抽取等。

安裝

要安裝Label-Studio,首先需要在命令行(cmd、terminal)執(zhí)行以下安裝命令:

# Python 3.8+
pip install doccano -i https://pypi.tuna.tsinghua.edu.cn/simplelabel

使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

運行 doccano

安裝完成后,可以通過以下命令來運行Label-Studio:

#在電腦第一次運行的時候初始化doccano
#只需設(shè)置一次,之后不用再運行該命令
doccano init

#創(chuàng)建用戶名及密碼;例如現(xiàn)在有一個主管admin,1個標(biāo)注員vipsoft
doccano createuser --username admin --password 123456
doccano createuser --username vipsoft --password 123456

#開啟doccano服務(wù)
doccano webserver

完成上述操作后,另打開一個新的命令行,執(zhí)行下列命令:

# In another terminal, run the command:
doccano task

使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

打開 doccanno

在瀏覽器里輸入:
http://localhost:8000/
支持中文,挺好
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注
輸入用戶名密碼:
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

創(chuàng)建項目

Label-Studio支持抽取式任務(wù)項目創(chuàng)建和分類式任務(wù)項目創(chuàng)建。為了創(chuàng)建項目,可以按照以下步驟進(jìn)行:

  • 抽取式任務(wù)項目創(chuàng)建

    適配命名實體識別、關(guān)系抽取、事件抽取、評價觀點抽取等任務(wù)

  • 分類式任務(wù)項目創(chuàng)建

    適配文本分類、句子級情感傾向分類等任務(wù)。

為創(chuàng)建項目,如圖點擊Create按鈕。根據(jù)需要選擇合適的項目類別,這里選擇 文本分類 Text Classification
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

上傳數(shù)據(jù)

可以通過以下鏈接下載實驗數(shù)據(jù):
https://hidadeng.github.io/blog/doccano_text_anotation/data.csv
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

上傳數(shù)據(jù)
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注
下面的 review 對應(yīng) csv 里的列
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

定義標(biāo)簽

點擊左側(cè)菜單中的“Labels”按鈕來定義標(biāo)簽。在標(biāo)簽編輯器頁面中,可以通過指定標(biāo)簽文本、快捷鍵、背景顏色和文本顏色來創(chuàng)建標(biāo)簽。
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注
同理,可以定義負(fù)面neg標(biāo)簽,F(xiàn)在有了pos和neg兩個標(biāo)簽。
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

添加成員

點擊左側(cè)目錄中的 Members 按鈕,然后,選擇“Add”按鈕以顯示表單。使用您要添加到項目中的用戶名和角色填寫此表單。然后,選擇“Save”按鈕。如果沒有可供選擇的成員,記得創(chuàng)建成員。 doccano createuser --username tom --password 123456
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

開始標(biāo)注

點擊導(dǎo)航欄中的 Start annotation 按鈕,開始對文檔進(jìn)行批注了
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

導(dǎo)出數(shù)據(jù)

到“Dataset”頁面,然后單擊“操作”菜單中的“Export dataset”按鈕。選擇導(dǎo)出格式后,單擊“Export”。
使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

查看數(shù)據(jù)

import pandas as pd

df = pd.read_csv('all.csv')
df

使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

統(tǒng)計

使用Label-Studio進(jìn)行數(shù)據(jù)標(biāo)注

小編推薦閱讀

好特網(wǎng)發(fā)布此文僅為傳遞信息,不代表好特網(wǎng)認(rèn)同期限觀點或證實其描述。

相關(guān)視頻攻略

更多

掃二維碼進(jìn)入好特網(wǎng)手機版本!

掃二維碼進(jìn)入好特網(wǎng)微信公眾號!

本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]

湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)