Sivun sisältö:
- Pienet ristikkokuvat tekoälyllä
- Pääkuvat tekoälyllä
- Johtopäätöksiä
- Hinnoittelu
- Tekijänoikeus- ja käyttöoikeuskysymykset
Tässä kommentissa käsiittelen maksullisia Midjourney (Discord-sovellus) sekä niji . journey (Android– tai iOS-sovellus) luotuja kuvia sekä DALL-E:tä, joka Microsoft Bing Image Creator yhteydessä on ilmainen, mutta muuten maksullinen.
Niji . journey ja Midjourney ovat samoilta tekijöiltä. Kun kirjautuu Midjourneyhyn luoden Discord tilin, samalla tilillä voi käyttää myös niji-sovellusta eli saa kaksi sovellusta samaan hintaan. Midjourneyllä oletusasetukset ovat valokuvamaisisten kuvien luonmissa ja niji.journeyllä animessa. Midjourneystä on myös nettiversio.
Pienet ristikkokuvat tekoälyllä
Tekoälyllä saa myös pieniä ristikkokuvia.
DALL-E ei ole esivalintaa, jolla saisi 1cmx1cm ruutuun sopivia yksinkertaisia kuvia, mutta sitä voi komentaa tekemään sellaisia esim. tekstillä:
clip art style face of angry man without background
Kun laitoin taiteilijaksi Frida Kahlo, lopputulos oli seuraavan näköinen:
Laittamalla Midjourneylle sanat ”minimalistic drawing” sanojen ”clip art” sijaan ohjelma luo mustavalkoisia piirroksia.
’
niji . journey Android-sovelluksella sain ”clip art” sanojen kanssa seuraavat kuvat.
Mielestäni toinen ja neljäs kuva toimisivat ristikkokuvituksena.
Alla niji . journeyllä luotu kuva kissasta. Ohjeeksi on annettu seuraava teksti:
clip art style with strong outlines happy cat
Alla on Midjourneyn samoilla sanoilla luomat kuvat.
Ainakin lasten ristikkoon nuo kuvat olisivat kivoja!
Yksinkertaisten piirroskuvien luomisessa voi kokeilla lisämällä ohjeisiin sanoja ”minimalistic”,”extemely minimized” ”logo”, ”icon”, ”simple” ”silhouette” tai ”simplified”
Midjourneyllä lisäyksellä ”minimalistic” hevoskuvista tuli seuraavan näköisiä (taustaväri jäi määrittämättä valkoiseksi). Yhdestä kuvasta leikkasin turhat pois, jotta kuvan voisi paremmin kuvitella sijoitettavaksi yhteen ruutuun.
DALLE-E ”drawing minimalistic horse on white background” tulee todella yksinkertaistettu kuva hevosesta.
Niji.journey ja Midjourney vaatii yksinkertaisiin kuviin kehotteen luoda hyvin yksinkertaisia kuvia, esim. ”drawing two extremely simplified black and white scandinavian houses on white background” tai väreillä ”drawing two extremely simplified scandinavian houses using few clear colors on white background”, jolloin tule hauskoja piirroskuvia. Alla niji-journeyn luomia kuvia. Se onnistuu mielestäni edellä olleella määrityksellä pikkukuvissa paremmin kuin Midjourney.
Kun lisäsin niji.journeyllä tarkennuksen ”Use strong lines when drawing them in order that they look good also scaled down into small size.” se teki aavistuksen verran vahvempaa viivaa. Alla olevassa kuvassa ylempien tuottamisiin on lisätty tässä kappaleessa mainittu teksti.
Kehottamalla luomaan ikoneja, saa ainakin osassa variaatioista vahvaviivaisia kuvia, jotka toimivat hyvin 1cmx1cm kokoisina. Midjourney loi ohjeella ”car,simple black and white icon, white background,no borders” alla olevia kuvia. Kuvista saa lukemattomia variaatioita, joten samaa kuvaa ei tarvitse koskaan käyttää kahta kertaa.
Midjourneylle ja niji.journeylle voi määrittää myös parametrin ”–no” eli mitä ei pidä kuvassa olla. Sekään ei aina luo haluttua lopputulosta.
Lisäyksellä ”minimalistc logo” Midjourneyllä tulee kuvaan useille logoille ominaista taustaa. Taustavärin voinee määritellä valkoiseksi.
DALL-E ”drawing logo image from male chicken on white background” tekee kukosta seuraavanlaisen kuvan.
Midjourney ei ”logo” lisäyksellä tee aina kehyksiä vaan luo hyvin pelkistettyjä kuvia, esim.
DALL-E ”drawing simplified silhouette image from male chicken on white background” tulee mustavalkoinen siluettikuva, joita voi tarvita, jos tilaa jää hyvin vähän.
Midjourneyllä ja niji.journeyllä siluettikuvien luonti edellyttää täsmennyksen ”Outlines of the image must be black and contious. The image must be entirely black.”
Ilman täsmennystä tulee kyllä ristikkoon sopivia kuvia, mutta ne eivät ole siluettikuvia.
Kahden viimeksi esille laittamani kuvan kaltaisia pelkistettyjä kuvia käyttävät esim. Brigitta Kalpa ja Alf Simberg.
Tekoälyillä voi siis saada hyvinkin yksinkertaisia kuvia. Ongelmaksi voi muodostua se, että kuvien tyyli on epäyhtenäistä. Niji . journeyssä tyylejä on vähän. DALL-E:lle on esim. WordPressin lisäohjelmalla käytettynä saa esivalittuja tyylejä, mutta harva niistä sopii ristikoiden kuvitukseen. Bing Image Creatorin kanssa tyylivalintoja ei ole. Ilman esivalintoja tyyli täytyy kuvailla ohjelmalle hyvin. Tekoälyn käyttö edellyttää hyvin paljon kokeiluja.
Pääkuvat tekoälyllä
11.11.2023 IS:n kovisristikkoon niji . joyrney -sovelluksella olisi saanut esim. tämän näköiset pääkuvat.
Ongelma pääkuvissa on se, että tekoälyllä ei saa aina sitä, mitä haluaa. Ohjelma ei aina noudata annettuja ohjeita, esim. seuraava ohje ei täysin toiminut. Yrtin saada IS 18.11.2023 sopivan pääkuvan tekoälyllä.
drawing woman and man running in a scandinavian forest track going opposite directions
Sanat ”opposite directions” jäivät lähes joka kuvassa huomioimatta, vaikka muuten nättejä piirroskuvia syntyikin. Ohjelma tekee aina neljä versiota kerralla. Alla on minusta paras versio (kaksi muutakin olivat onnistuneita, mutta yksi neljästä oli minusta hieman epäonnistunut).
Annoin tarkemman ohjeen.
drawing woman and man running in a scandinavian forest track going to the opposite directions, woman to the right an man to the left
Ei auttanut. Ei tullut kahta vastakkaisiin suuntaan juoksevaa henkilöä.
Kahta kuvaa yhdistämällä tuli väärän muotoinen lopputulos.
Tekoälyä on siis joskus vaikea tai mahdoton ohjeistaa yhdistelmäkuvissakin niin, että syntyy juuri halutunlainen kuva.
Kuvien yhdistely onnistuu kyllä yksinkertaisissa tilanteissa. Alla on varsin onnistunut yhdistelmäkuva, jossa ilman taustaa oleva labdadorin noutaja on yhdistetty talvimaisemaan.
Jos tekoälyllä ei saa yksittäistä kuvista Silloin pitää tehdä itse kasaustyötä tekoälyn luomista yksittäisistä kuvista. Kasattu lopputulos näyttää helposti kasatulta, jos ei jollakin ohjelmalla häivytä reunoja. Reunojen häivytys vaatii osaamista ja se on hidasta käsityötä. Kuvia luovien tekoälyjen kehitys on kuitenkin vielä varsin alkuvaiheessa, joten kuvien hallittu yhdistäminen onnistunee tulevaisuudessa paremmin.
Ongelmana ovat myös henkilökuvat. Tunnistaakohan alla olevasta kuvasta keistä on kyse? Tiettyyn henkilöön liittyviä valokuvia tekoäly ei nykyisellään korvaa, mutta varmaan tässäkin asiassa tulee tapahtumaan edistystä.
Karikatyyrin sain lisäämällä sanat ”cartoon style”:
Bidenistä tuli loistavan hyvä sarja. Midjourleylle voi antaa nettiosoitteen, josta ohjelma ottaa mukaan kuvan. Sauli Niinistöstä ohjelma ei saanut aikaiseksi julkaisukelpoisia kuvia.
Kyösti ”Köpi” Kalliosta ei karikatyyriä pyydettäessä tullut lainkaan näköinen kun syötin ohjelmalle erään hänestä olevan kuvan.
Ohjelma kaivannee paljon materiaalia tunnistettavien kuvien luomiseen.
Midjourney ja niji.journey ja -sovelluksilla saa hyvin valokuvamaisia kuvia. DALL-E ei valokuvamaisiin kuviin tällä hetkellä pysty. Niji.journeyn valokuvamaiset kuvat ovat oletusasetuksilla usein hieman piirrosmaisia, mutta sen voi määrittää toimimaan Midjourneyn tapaan (vastaavasti Midjourneyn voi määrittää toimimaan niji.journeyn tapaan). Alla jouluinen valokuvamainen kuva.
Johtopäätöksiä
Tekoäly tuskin korvaa Suomessa Markku Mäkelän kaltaista omaperäistä piirroskuvitusta. Yhtä laadukasta kuvitus kyllä voisi olla. Jos tykkää juoksevia nuoria esittävästä kuvan kaltaisesta japanilaisvaikutteisesta kuvituksesta tekoälyllä voisi saada häikäisevän kaunista kuvitusta, joka peittoaisi mennen tullen tavanomaisen kuvituksen.
Tekoäly voisi tehdä lähes täysin tarpeettomaksi kaikki tavanomaista kuvitusta tarjoavat kuvittajat. Sen käyttö voisi parantaa sellaisten ristikoiden kuvituksen laatua, jossa laatija, jonka piirustustaidot eivät ole hyvät, mutta laatija silti kuvittaa itse ristikoitaan.
Clip art -kokoelmat tai Corel Draw ohjelman käyttö kuvien luomisen joutanevat lähitulevaisuudessa samaan tapaan historiaan kuin tietosanakirjat. Clip-art -kokoelmia tai piirrosohjelmia ei yksinkertaisesti juuri kaivattaisi ristikkokuvituksen luomisessa. Clip art -kokoelmat saisi ehkä hävittää kokonaan turhina kuten vanhat tietosanakirjat joutavat kierrätykseen. Uskon tekoälyn syrjäyttävän clip art -kuvat ja Corel Draw -tyypisten ohjelmien käytön ristikkokuvien tuottamisessa.
Vain erityistilanteissa pitäisi käyttää piirrosohjelma apua. Sitä tarvitaan tilanteissa, joissa kuvien yhdistely tekoälyllä ei onnistu sekä puhekuplien lisäämisessä kuvaan.
Myös tilanteissa, joissa tekoäly ei tuota tarvittavaa kuvaa, tarvitsee kuvat tehdä muuten kuin tekoälyllä. Tekoälyä voi käyttää kuitenkin tällöinkin apuna.
Loin 28.11.2023 Ilta-Sanomien Kovis-ristikkoon periaatteessa soveltuvan pääkuvan siten, että teetätin niji.journeyllä kolme kuvaa: taustakuva sekä juokseva mies ja juokseva nainen valkoisella taustalla. PhotoDirector-ohjelmalla poistin henkilöiltä taustavärin. Yhdistin kuvat ibisPaintX-ohjelmalla, jolla lisäsin puhekuplan ja siihen tekstin. Hieman jouduin korjaamaan yhtä kuvaa. Aikaa meni ehkä 15 minuuttia ja alla on lopputulos.
Varsin kustannustehokasta toiminta olisi vain osittaisestikin tekoälyä hyödyntäen. Kuvia saattaa joutua teettämään useita, jotta lopputulos on toivottu. Yllä olevassa kuvassa jää hieman epäselväksi mihin suuntaan henkilöt juoksevat. Kuvia olisi ehkä pitänyt teetättää enemmän, mutta kuva kuitenkin osoittaa, miten tekoälyn tuottamat kuvat voi koostaa lopulliseksi kuvaksi myös ei-automaattisesti.
Tosin voi olla, että esimerkin kuva on liian ohuella viivapaksuudella luotu pääkuvaksikin tarkoitettuun kuvaan, joten IS:n 18.11.2023 ristikon pääkuva saattaa sen takia olla parempi. En osaa arvioida, miltä luomani demokuva näyttäisi sanomalehdessä.
Puhekuplat saa periaatteessa ainakin DALL-E:llä luotua, mutta niihin tulee aina väärä teksti, joten käytännössä voi luoda vain tyhjiä puhekuplia. Alla on esimerkkikuva, joka on luotu Microsoft Bingin kuvageneraattorilla – ei tule se teksti, jonka ibisPaintX:llä lisäsin.
Kaikki eivät kuitenkaan halua opetella tekoälyn käyttöä kuvituksessa eikä heillä ole aikaa kuvittaa ristikoitaan. Firman kuvittajan pitää hoitaa tällöin ulkoasu. Mutta firma voisi säästää tällaisessa tapauksessa tekoälyä käyttäen, jos se velvoittaa kuvittajat käyttämään aina kun mahdollista tekoälyä. Pitää vain löytää säädöt, jossa tekoäly loisi mahdollisimman samantapaisella tyylillä kuvia kuin mitä kuvittaja itse loisi.
Jos sanaristikoita tuottava firma käyttäisi tekoälyä, sanaristikoita tekevässä firmassa kuvittajalla olisi hyvä olla käytössään niji.journey, Midjourney ja DALL-E, joista sitten tilanteesta riippuen valitsisi parhaan. Jos kuvittaja lisää puhekuplat, suosittelen niji.journey/Midjourney-paria. Näistä niji.journey on helppokäyttöisempi kuin Midjourney Discord-sovellus. Molemmissa on useita kuvasuhteita. Niillä saa valokuvamaisia kuvia, magnatyyppisiä kuvia ja pikkukuvia.
Tekoälyn käytöllä tai sen käyttämättä jättämisellä on ratkojille merkitystä. Haluavatko ratkojat tyytyä epäselviin suttuisiin ristikkokuviin vai haluavatko he kaunista, persoonallisen oloista ja huippulaatuista ristikkokuvitusta. Tekoälyllä tällaista kuvitusta voidaan tehdä hyvin kustannustehokkaasti. Tekoälyllä saa niin hienoa kuvitusta, että kukaan kustantaja ei voisi kenellekään piirtäjälle maksaa nijn paljon, että joku tekisi ilman tekoälyä vastaavan tason kuvituksen.
Tekoälyn kanssa kauneusarvojen kanssa ei tarvitse tehdä mitään kompromisseja. Tekoälyn käyttö voisi periaatteessa nostaa keskimääräisen ristikkokuvituksen tason nykyisestä aivan eri luokkaan. Ei ole mitään rajoja sille, kuinka kaunista ristikkokuvitus voi olla, sillä maksimaalisen kauniin kuvituksen luominen ei ole juuri sen kalliimpaa kuin peruskuvituksen luominen. Tosin edellyttää kyllä sitä, että tekoäly tekee sen, mitä siltä pyydetään. Nyt tämän asian kanssa on vielä parannettavaa.
Midjourney tuottaa oletuksena aina neliömäisiä kuvia, mutta kuvien ohjeteksti jälkeen voi laittaa parametrin ”--ar”, esim. –ar 9:16, joka luo korkean ja kapean kuvan. Jos ei halua neliömuotoisia kuvia, parametri pitää aina antaa jokaisen kuvan teettämisen yhteydessä. Niji.journeyllä kuvasuhde määritellään apuvalikosta ja ohjelma käyttää uuden kuvan luodessaan oletusarvoisesti samaa kuvasuhdetta kuin mikä oli käytössä edellisen kuvan luonnissa.
Tavallinen käyttäjä voi kokeilla täysin ilmaisia tekoälyjä. Kaikkien testaamieni ilmaisten tekoälyjen suurin puute on se, että niillä ei saa käyttökelpoisia valokuvamaisia kuvia. Pääkuvia niilläkin saa.
DALL-E:n suurin puute on se, että sillä ei huippulaatuisia valokuvamaisia kuvia. Sillä luodut valokuvamaiset kuvat ovat jotain ilmaisohjelmilla ja Midjourneyllä saatavien kuvien väliltä. Piirrosmaisia pääkuvia ja pikkukuvia sillä saa. Varsinkin pikkukuvien luonti voi DALL-E:llä olla helpompaa.
Testattujen tekoälyjen edut:
- Nopeus. Normaalinopeudella kuva syntyy minuutin sisällä.
- Pääsääntöisesti kuvien erittäin korkea laatu.
- Kuvista saa variaatioita, jolloin koskaan ei tarvitse käyttää sanaa kuvaa kahta kertaa, jos ei välttämättä halua.
Testattujen tekoälyjen ongelmat:
- Suurin ongelma on se, että tekoäly ei pysty aina luomaan haluttua kuvaa suoraan (kuvia voi kuitenkin kasailla tekoälyllä tai muilla ohjelmilla).
- Puhekuplat eivät toimi vaan ne pitää jälkikäteen lisätä.
- Yhtenäisen tyylin löytäminen vaatii paljon kokeiluja ja täysin yhtenäistä tyyliä ei ehkä pysty saavuttamaan.
- Kuvien laatu on joskus riittämätön.
Hinnoittelu
DALL-E ei ole kuukausimaksua vaan hinnoittelu perustuu tuotettujen kuvien määrään. DALLE-E:llä saa ilmaiseksi neliönmuotoisia kuvia Bing Image Creatorin avulla. Ilmaisia kuvia saa 15kpl/päivä nopeasti tehtynä. Jos laskuri menee nollille, joutuu odottamaan pitkään. Maksullisena DALL-E:llä saa esim. WordPressin yhteydessä muitakin kuin neliömäisiä kuvia eikä päiväkohtaista kuvienluontirajoitusta ole.
Niji-journeyllä on kuukausimaksu. Midjourneyllä on kuukausimaksu tai vuosimaksu. Mutta on huomattava, että Midjourneyn tilillä on pääsy niji.journeyhyn ja päinvastoin. Jos haluaa kokeilla vain tietyn ajan, pitää tilaus lopettaa, ettei se uusiudu automaattisesti.
Tutustumishinnat ovat 3-10 € välillä + maksujen välityskustannukset. Minimihinta DALL-E:llä 5$, niji.journeyllä n. 6€ ja Midjourneyllä 10 $. Kun päälle tulee lisäkuluja em. neljän sovelluksen tutustumishinta on yhteensä n. 20€.
Kuvien suurennus maksaa erikseen, mutta kuvat ovat lähtökohtaisesti moneen paikkaan riittävän hyviä suurentamattakin. Kuvien hinta on käytännössä enemmän kuin neljä senttiä/kuva, koska hukkakuvia tulee runsaasti.
Jos Midjourneyllä tai niji.journeyllä kuukaudessa ei luo sallittua määrää kuvia, käyttämättä jäänet kuvanluontimahdollisuudet (credits) menevät hukkaan. Kun alin maksu on 10 $/kuukausi, ei Midjourney/niji.journey -parilla kuvien luonti tule kalliiksi. Sillä saa maksimissaan variointeineen n. 200 kuvaa, jolloin hinta n. 5 amerikan senttiä/kuva. Koska kuvasta saa erilaisilla kuvasuhteella kuvia ja käytössä on kaksi sovellusta, sitä voi pitää järkevimpänä ratkaisuna. Niji.journeytä on helpompi käyttää. Ongelmana on kyllä se, että ohjeita annettaessa virtuaalinäppäimistö peittää kirjoitettavan tekstin.
Niin ammattilaiselle kuin satunnaiselle käyttäjälle tekoäly on varsin halpa työkalu. Suositukseni on asentaa sekä Midjourney että niji.journey ja käyttää tilanteen mukaan jompaakumpaa. Välillä voi kokeilla Bingin ilmaista kuvageneraattoria. Paljon opettelua ja kokeilemista niiden sujuvassa käytössä tulee kyllä olemaan.
Tekijänoikeus- ja käyttöoikeuskysymykset
Esitin eräälle Sanarisille ristikoita laativalle, että hän kokeilisi tekoälyllä luotuja kuvia. Hänen nykyinen kuvitus vaikuttaa siltä, että hän tehnyt kuvituksen Corel Draw:lla tai Adobe Illustratorilla. Kerroin, että tekoälyllä saisi kauniimpia kuvia.
Laatija katsoi, ettei hän tekijäoikeudellisista syistä halua tutustua tekoälyn tuottamiin kuviin. Hänen mukaansa tekoäly usein käyttää valmista muiden tekemää materiaalia laittomasti netistä. Hän piti siten tekoälyn käyttöä eettisesti arveluttavana.
Laatijan näkökulma on oikeutettu. Midjourneyllä on tekijänoikeusongelmia. Sitä syytetään Helsingin Sanomissa olevsn artikkelin mukaan laittomasta taiteilijoiden teosten käytöstä tekoälyn koulutuksessa.
Syyte koskee muitakin tekoälyjä. Helsingin Sanomien jutun mukaan yksi siviilikanteen nostaneista taiteilijoista on valokuvaajana työskentelevä Jingna Zhang. Hän kertoo kanteesta Instagram-tilillään:
Olen liittynyt siviilikanteeseen Stability AI:ta, DeviantArtia, Midjourneyta ja Runway AI:ta vastaan muiden taiteilijoiden rinnalla. –– Tekijänoikeus ja sen suoja on tehnyt ammatistani mahdollisen. Mutta miljardien kuvien luvattomalle käytölle rakentunut tekoälymallien kaupallistuminen loukkaa tuota suojaa. Tätä ei pitäisi sallia
Tekoälyihin liittyy muitakin tekijäoikeus- tai käyttöoikeuskysymyksiä. Midjourneyllä Discordissa yleisissä kansioissa olevia muiden tuottamia kuvia saa hyödyntää.
Midjourney is an open community which allows others to use and remix Your images and prompts whenever they are posted in a public setting. By default, Your images are publically viewable and remixable.
Bingin kuvageneraattori lupaa kunnioittaa tekijöitä:
Suhtaudumme vakavasti sitoumukseemme käyttää tekoälyä vastuullisesti. Jos haluat lisätietoja siitä, miten käytämme vastuullista tekoälyä, siirry tänne.
Olemme ottaneet käyttöön rajoituksia haitallisten kuvien luomisen estämiseksi. Kun järjestelmämme havaitsee, että kehote voi luoda mahdollisesti haitallisen kuvan, se estää kehotteen automaattisesti ja ilmoittaa asiasta käyttäjälle.
Teemme myös selväksi, että Image Creatorin kuvat ovat tekoälyn luomia. Vesileima näkyy kunkin Image Creatorin luoman kuvan vasemmassa alakulmassa. Olemme ottaneet käyttöön C2PA-standardin mukaiset sisällön tunnistetiedot, joiden avulla käyttäjät voivat tunnistaa tekoälyn luomat kuvat. Sallimme elävien taiteilijoiden, julkisuuden henkilöiden ja organisaatioiden pyytää rajoittamaan nimiinsä ja brändeihin liittyvien kuvien luontia Ilmoita ongelmasta -lomakkeen tekoälypohjaisilla ominaisuuksilla.
Aiheeseen liittyvät säikeet foorumiosastolla:
Yhdistä näiden avulla:
Sulje lisäikkuna