久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

博客專欄

EEPW首頁 > 博客 > 有沒有什么可以節省大量時間的 Deep Learning 效率神器?

有沒有什么可以節省大量時間的 Deep Learning 效率神器?

發布人:計算機視覺工坊 時間:2022-12-22 來源:工程師 發布文章
作者丨金瀛若愚@知乎(已授權)

來源丨https://www.zhihu.com/question/384519338/answer/2620482813 編輯丨極市平臺1. 每個實驗保存完整config + wandb遠程追蹤

還在給model取巨長的文件名來記錄其超參嗎?out了。wandb可以把config和結果曲線同步云端供橫向評比和查看。同步云端的代碼:

def wandb_init(cfg: DictConfig):
    wandb.init(
        project='best paper',
        group=cfg.exp_group,
        name=cfg.exp_name,
        notes=cfg.exp_desc,
        save_code=True,
        config=OmegaConf.to_container(cfg, resolve=True)
    )
    OmegaConf.save(config=cfg, f=os.path.join(cfg.ckpt_dir, 'conf.yaml'))

這里的OmegaConf下面會講到。想不起來某個實驗的model存在哪了?看wandb的界面查找每個config值

圖片

wandb 查看config

對應每個實驗的curves

圖片

wandb查看曲線

2. Hydra+OmegaConf配置管理

OmegaConf是Meta出的配置管理工具,可將yaml文件轉成有對應變量名的Python的class或dict。支持默認值、合并和override、導出成yaml或json等,十分好用。你再也不用手寫配置管理了。

比如:

blob_root: /yjblob
exp_name: best_paper_2
ckpt_dir: ${.blob_root}/${.exp_name}/ckpt
log_dir: ${.blob_root}/${.exp_name}/log

上面是config.yaml的片段,OmegaConf.resolve(cfg) 一句即可把blob_root和exp_name 的值填進 ckpt_dir里。而普通的yaml是不支持變量的。

Hydra是Meta出的實驗提交工具,支持在命令行里動態修改OmegaConf里面的數值。Hydra支持一個config里引用另一個config,于是你可以很容易的切換用db=mysql還是db=postgresql:

├── conf
│   ├── config.yaml
│   ├── db
│   │   ├── mysql.yaml
│   │   └── postgresql.yaml
│   └── __init__.py
└── my_app.py 

而且,這個OmegaConf的配置(DictConfig類型)可以轉成Python的dict然后傳給wandb,打通全場(見第一節的示例代碼)。

3. Plotly導出可交互的曲線

Matplotlib不支持交互,生成的曲線無法還原每個點的值。Tensorboard和wandb的網頁 支持交互,但不容易導出,而且其內置的precision-recall曲線等函數無法深度定制,只適合于畫一些loss和lr曲線。Plotly就很強了。

圖片

鼠標浮動,查看內容

當然也可以做定制化的precision-recall曲線。比如我希望看不同threshold下的precision, recall和false positive ratio,這樣的定制化曲線wandb等并不支持,就可以用plotly

df = DataFrame({
    'thres': thresholds,
    'prec': prec_data1,
    'recl': recl_data1,
    'fp': fp_data2
})
df = df.melt(id_vars=['thres'], value_vars=['prec''recl''fp'], var_name='curves')
fig = px.line(df, x='thres', y='value', color='curves', markers=True)
fig.update_xaxes(range=[0, 1])
fig.update_yaxes(range=[0, 1])
fig.update_traces(mode="markers+lines", hovertemplate=None)
fig.update_layout(hovermode="x")
fig.write_html(os.path.join(self.cfg.ckpt_dir, 'curves.html'), auto_play = False)

里面的hovermode指定移動鼠標時顯示相同x值的不同y值:

圖片

這還沒完,wandb支持把plotly生成的可交互網頁嵌入到wandb里

import wandb
import plotly.express as px

# Initialize a new run
run = wandb.init(project="log-plotly-fig-tables", name="plotly_html")

# Create a table
table = wandb.Table(columns = ["plotly_figure"])

# Create path for Plotly figure
path_to_plotly_html = "./plotly_figure.html"

# Example Plotly figure
fig = px.scatter(x = [0, 1, 2, 3, 4], y = [0, 1, 4, 9, 16])

# Write Plotly figure to HTML
fig.write_html(path_to_plotly_html, auto_play = False) # Setting auto_play to False prevents animated Plotly charts from playing in the table automatically

# Add Plotly figure as HTML file into Table
table.add_data(wandb.Html(path_to_plotly_html))

# Log Table
run.log({"test_table": table})
wandb.finish()

以上便完成了Hydra+OmegaConf+wandb+plotly的打通。

4. 使用遠程GPU服務器/集群的一些技巧

如果要使用遠程的服務器,常見問題在于遠程debug、代碼從本地同步到遠程以及ssh斷線重連問題。這些可以使用VS Code解決。

  1. 可以設置用得到的所有遠程服務器,每個服務器配置好ssh,便于隨時登錄。下圖的REMOTE EXPLORER里除了SSH Targets還有Containers,即可以直接ssh到服務器的docker container里。container的運行命令可以設置vs code自動完成。
圖片
  1. 每個服務器都能從本地登錄的git賬戶里clone代碼。Clone之后下次可以直接遠程打開這個repo
圖片
  1. 編輯Run and Debug設置(launch.json),可以預先設置training,testing等實驗對應的命令行參數和環境變量,以后點對應的按鈕就直接運行該實驗。不用每次手動復制參數
圖片
  1. 在repo里開一個文件夾,加入gitignore。每次做可視化圖片的時候,把圖片存到這個文件夾,即可通過vscode遠程看圖,不需要每次ssh下載到本地。VS Code也支持內建ipynb文件來一邊寫一邊運行。

本文僅做學術分享,如有侵權,請聯系刪文。



*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



關鍵詞: AI

相關推薦

技術專區

關閉