当前位置:首页 > 探索

AI繪圖步數(steps)越多越好嗎?以真人版《鏈鋸人》瑪奇瑪為例

文:巴洛克大叔

前言

以下測試同樣都是繪圖好嗎使用stable diffusion webui。

  1. 據我之前看過的步數版鏈網路文章或網路討論,大多是真人指繪圖步數越高則繪圖細節會越多,但其正面效益會隨著步數的鋸人持續增加而遞減。但我並沒有看到有人明確的瑪奇瑪為描述細節的提昇到底是提昇在哪?可以提昇多少?效益的遞減又是怎麼遞減的?我只好自己測一次才會甘願了。
  2. 上次的繪圖好嗎《鏈鋸人》瑪奇瑪畫的太醜,我這次決心重畫一次。步數版鏈
  3. 我還是真人不知道到底要叫真紀真還是叫瑪奇瑪。

以下是鋸人我的測試內容,我簡單的瑪奇瑪為列出圖片並講解我觀察到的現象就好。本來我的繪圖好嗎測法是10步一個階段,後來發現這樣產出的步數版鏈圖太多太雜,外加每10步一階段可能看不出變化,真人最後改成每20步一階段,鋸人最後測到120步確實是瑪奇瑪為太誇張,這只是為了能夠產出6張圖讓我貼圖時比較對稱而已。

一、步數高,並不保證圖片就會更漂亮或更正確

提升步數造成的結果仍充滿隨機性,不一定步數多就會畫的正確或漂亮,例如下圖是以DPM++SDE Karras為採樣方式,本來畫的算是正確,但在60步與100步時眼睛反而變的略醜略歪。

未命名圖片來源:巴洛克大叔 via stable diffusion webui
未命名圖片來源:巴洛克大叔 via stable diffusion webui
未命名圖片來源:巴洛克大叔 via stable diffusion webui
眼睛在100步時反而變醜了

二、繪圖結果不一定會受步數影響,也有可能毫無變化

雖說大部份的情況下,步數的變化通常會影響到繪圖內容,不論是變好還是變壞,但這不是絕對的。下圖是以UniPC為採樣方式,到60步以後的圖就基本不變了,甚至到了100步/120步時的產出已經是連細節都完全一致了。

未命名圖片來源:巴洛克大叔 via stable diffusion webui
未命名圖片來源:巴洛克大叔 via stable diffusion webui

三、畫面變大,不代表細節就一定可以變多

這是上一個項目的延伸題,在第二項測試中,我們觀察到UniPC到60步以後就不太變化了,我猜測是否因為畫面太小造成它的變化空間有限?所以我把畫面尺寸調大後再試一次(由600x800調整為1024x768)。

但很明顯的,畫面變大之後並沒有什麼改變,這次一樣是60步以後的圖就不太有變化了,而80步以後的三張圖連細節都完全一致。大圖片可以呈現的內容確實更多更豐富,但那是跟畫面尺寸有關,跟步數的增加沒什麼關係。

未命名圖片來源:巴洛克大叔 via stable diffusion webui
未命名圖片來源:巴洛克大叔 via stable diffusion webui

四、LMS/DPM fast/PLMS這三種採樣方式,所需要的基本步數比別種採樣方式高,就是這樣而已

這個項目是為了我自己的妄想而測的,從我之前的測試中可知LMS/DPM fast/PLMS這三種採樣方式,在20~30步時是一定畫不好圖的,它必須有較高的基本步數,那我就懷疑它只是單純的比較沒力,還是它有藏招?也許在高步數時才能體現出它的威力?

顯然,它真的只是沒力而已,這三種都要在40~50步左右才能出圖,但步數繼續升高並沒有表現出什麼驚艷之處。以下貼出其中兩種採樣方式的圖做為代表就好。

LMS的結果:

未命名圖片來源:巴洛克大叔 via stable diffusion webui
未命名圖片來源:巴洛克大叔 via stable diffusion webui

DPM fast的結果:

未命名圖片來源:巴洛克大叔 via stable diffusion webui
未命名圖片來源:巴洛克大叔 via stable diffusion webui

五、細節就算真的有增加,也未必是加在你想要的地方

下圖以Euler a為例,這邊是一個典型的好例子,隨著步數增加,每次的圖片內容都有變化,而且都沒畫歪。但問題是它的細節也許是真的有隨著繪圖步數增加,但都加在沒意義的地方。

我們一般會期望細節可以加在重點部份,例如以下方人物圖來說就是會希望它能夠增加更多的人物細節/皮膚紋路/光影效果等等。結果它全在折騰那片背景,它就是把A招牌改成B招牌,或是把C建築改成D建築這樣改來改去不知所云。

未命名圖片來源:巴洛克大叔 via stable diffusion webui
未命名圖片來源:巴洛克大叔 via stable diffusion webui

六、適可而止就好

下圖同樣以Euler a為例,這同樣是一個典型的好例子。步數的增加都有確實造成圖片的變化,而且細節確實是有提昇。

未命名圖片來源:巴洛克大叔 via stable diffusion webui
未命名圖片來源:巴洛克大叔 via stable diffusion webui

縮圖也許不明顯,我直接抓出20步與120步的頭部來做對比:可以很明顯的看出20步時臉部像開了美顏,也缺乏光影效果,120步時就看的出皮膚紋路與光影效果了,髮部細節也增加許多。

未命名圖片來源:巴洛克大叔 via stable diffusion webui
20步
未命名圖片來源:巴洛克大叔 via stable diffusion webui
120步

但為了追求這樣的效果就故意設成120步其實不是個划算的選擇,如果只是想要有更多的皮膚紋路與光影效果,40~60步之間就有達成不錯的成果了。步數再往後增加的效益已是肉眼難辨,繪圖時間與繪圖效果不成正比,沒有CP值。

未命名圖片來源:巴洛克大叔 via stable diffusion webui
40步

七、想光靠步數增加細節不切實際

這步就不用上圖了,這是上面所有圖片的觀察總結,從上面的圖片可以發現,步數的增加也許能夠對圖片造成一些正向變化,但這些變化是微小且不可控的。最終的繪圖成品差異都不算太大,甚至還有幾個越弄越糟的例子。

因此若真想精心打造一張高細節的複雜圖片,從別的地方下手也許效益更明顯。例如修改prompt或是引入一些圖片美化的外掛等等。再嫌不足可以用inpant等方式慢慢去刻,反正都會比一直狂加步數實在。

我個人的想法是也許步數設成20~30左右就夠了,若覺得不足就直接從其它地方去做改善比較實際,圖片主體在20~30步就算完成了,之後增加更多的步數意義已經不大,可能僅是微小的錦上添花,甚至是畫蛇添足。

八、動漫風格也測一下

這邊沒什麼話要說,只是想看看動漫風格的效果而已

未命名圖片來源:巴洛克大叔 via stable diffusion webui
未命名圖片來源:巴洛克大叔 via stable diffusion webui

總結

  • 步數高並不保證圖片就會更漂亮或更正確。
  • 繪圖結果不一定會受步數影響,也有可能毫無變化。
  • 畫面變大不代表細節就一定可以變多。
  • LMS/DPM fast/PLMS沒有藏招,它們真的只是單純的低步數就畫不出圖。
  • 細節就算真的有增加,也未必是加在你想要的地方。
  • 步數的增加適可而止就好。
  • 想光靠步數增加細節不切實際。

本文經《方格子》授權轉載,原文發表於此
原標:AI繪圖-繪圖步數(steps)越高會越好嗎?(以真人版鏈鋸人瑪奇瑪為例)

延伸閱讀

  • 相較於AI繪圖的作品,其背後的科技再造靈魂之美反倒更貼近「藝術」
  • 微軟Bing AI繪圖工具Image Creator免費開放,如何利用ChatGPT下繪圖指示?
  • 【AI繪圖時代】智慧財產權學者談AI作品法律爭議:如何判斷AI生成圖像是否侵權?誰能擁有著作權?

【加入關鍵評論網會員】每天精彩好文直送你的信箱,每週獨享編輯精選、時事精選、藝文週報等特製電子報。還可留言與作者、記者、編輯討論文章內容。立刻點擊免費加入會員。

責任編輯:朱家儀
核稿編輯:翁世航


分享到:

京ICP备19007577号-5