Apa itu GAN? Bagaimana dan mengapa anda harus menggunakannya!

Artikel ini merangkumi penjelasan terperinci mengenai 'What are GANs' dengan batasan dan cabaran yang meliputi proses latihan dan Pelaksanaan Case Use.

Rangkaian Adversarial Generatif atau GAN adalah pendekatan pemodelan generatif menggunakan Pembelajaran Dalam untuk melatih model dengan cara yang bijak untuk menghasilkan data dengan menggunakan pendekatan sub-model. Dalam artikel ini, kami akan cuba memahami 'Apa Itu GAN' secara terperinci. Topik berikut dibahas dalam artikel ini:

Apakah Model Generatif?

Model generatif tidak lain adalah model yang menggunakan pendekatan. Dalam model generatif, ada sampel dalam data iaitu pemboleh ubah input X, tetapi kekurangan variabel output Y. Kami hanya menggunakan pemboleh ubah input untuk melatih model generatif dan ia mengenali pola dari pemboleh ubah input untuk menghasilkan output yang tidak diketahui dan berdasarkan data latihan sahaja.





Dalam , kita lebih sejajar dengan membuat model ramalan dari pemboleh ubah input, pemodelan jenis ini dikenal sebagai pemodelan diskriminatif. Dalam masalah klasifikasi, model harus membezakan kelas mana contohnya. Sebaliknya, model yang tidak diawasi digunakan untuk membuat atau menghasilkan contoh baru dalam pengedaran input.

tukar dari berganda menjadi int

Untuk menentukan model generatif dalam istilah awam, kita boleh katakan, model generatif, dapat menghasilkan contoh baru dari sampel yang tidak hanya serupa dengan contoh lain tetapi juga tidak dapat dibezakan.



Contoh model generatif yang paling biasa ialah yang lebih kerap digunakan sebagai model diskriminatif. Contoh lain model generatif termasuk Model Campuran Gaussian dan contoh yang agak moden iaitu Jaringan Adversarial Umum. Mari kita cuba memahami Apa itu GAN?

Apakah Rangkaian Adversarial Generatif?

Rangkaian Adversarial Generatif atau GAN adalah model generatif berasaskan pembelajaran mendalam yang digunakan untuk Pembelajaran Tanpa Pengawasan. Ini pada dasarnya adalah sistem di mana dua bersaing Rangkaian Neural saling bersaing untuk membuat atau menghasilkan variasi dalam data.

Ini pertama kali dijelaskan dalam makalah pada tahun 2014 oleh Ian Goodfellow dan teori model yang standard dan jauh stabil telah diusulkan oleh Alec Radford pada tahun 2016 yang dikenali sebagai DCGAN (Deep Convolutional General Adversarial Networks). Sebilangan besar GAN yang ada sekarang menggunakan seni bina DCGAN.



Seni bina GAN terdiri daripada dua sub-model yang dikenali sebagai Model penjana dan juga Model Diskriminasi. Mari kita cuba memahami bagaimana GAN sebenarnya berfungsi.

Bagaimanakah ia berfungsi?

Untuk memahami bagaimana GAN berfungsi, mari pecahkan.

  • Generatif - Ini bermaksud bahawa model mengikuti pendekatan dan merupakan model generatif.
  • Adversarial - Model ini dilatih dalam situasi lawan
  • Rangkaian - Untuk latihan model, gunakan rangkaian neural sebagai algoritma kecerdasan buatan.

Dalam GAN, terdapat rangkaian Generator yang mengambil sampel dan menghasilkan sampel data, dan setelah ini, rangkaian Discriminator memutuskan sama ada data itu dihasilkan atau diambil dari sampel sebenar menggunakan binari masalah dengan bantuan fungsi sigmoid yang memberikan output dalam julat 0 hingga 1.

carta alir - apa itu gnas - edureka

Model generatif menganalisis penyebaran data sedemikian rupa sehingga setelah fasa latihan, kebarangkalian diskriminasi melakukan kesalahan memaksimumkan. Dan Discriminator, sebaliknya, berdasarkan model yang akan menganggarkan kebarangkalian bahawa sampel itu berasal dari data sebenar dan bukan penjana.

Seluruh proses dapat diformalkan dalam formula matematik yang diberikan di bawah.

Dalam formula di atas:

G = Penjana

D = Pembeza

Pdata (x) = Pembahagian data sebenar

Pdata (z) = Pengedar penjana

x = sampel dari data sebenar

z = sampel dari penjana

dapatkan panjang array js

D (x) = Rangkaian Diskriminator

G (z) = Rangkaian Penjana

Sekarang datang bahagian latihan untuk GAN, yang selanjutnya dapat dibahagikan kepada 2 bahagian yang dilakukan secara berurutan.

Bagaimana Melatih GAN?

Bahagian 1:

Latih pembeza dan beku penjana, yang bermaksud set latihan untuk penjana diubah sebagai Salah dan rangkaian hanya akan melakukan hantaran ke depan dan tidak akan berlaku penyebaran balik.

Pada dasarnya diskriminator dilatih dengan data sebenar dan memeriksa apakah ia dapat meramalkannya dengan betul, dan sama dengan data palsu untuk mengenal pasti mereka sebagai palsu.

Bahagian 2:

Latih generator dan beku pembeza. Pada fasa ini, kita mendapat hasil dari fasa pertama dan dapat menggunakannya untuk membuat yang lebih baik dari keadaan sebelumnya untuk mencuba dan memperbodohkan pembeza.

Langkah Untuk Latihan

  1. Tentukan Masalahnya - menentukan masalah dan mengumpulkan data.
  2. Pilih Senibina GAN - Bergantung pada masalah anda pilih bagaimana rupa GAN anda.
  3. Latih Discriminator Mengenai Data Sebenar - Latih pendiskriminasi dengan data sebenar untuk meramalkannya sebagai nyata untuk beberapa kali.
  4. Hasilkan Input Palsu Untuk Penjana - Hasilkan sampel palsu dari penjana
  5. Latih Discriminator Mengenai Data Palsu - Latih diskriminator untuk meramalkan data yang dihasilkan sebagai palsu.
  6. Train Generator Dengan Hasil Diskriminasi - Setelah mendapat ramalan diskriminator, latih penjana untuk memperbodohkan pembeza

Cabaran Rangkaian Adversarial Generatif

Konsep GAN agak menarik tetapi terdapat banyak kemunduran yang boleh menyebabkan banyak halangan dalam perjalanannya. Beberapa cabaran utama yang dihadapi oleh GAN adalah:

  1. Kestabilan diperlukan antara diskriminator dan penjana jika tidak, keseluruhan rangkaian akan jatuh. Sekiranya, Discriminator terlalu kuat, penjana akan gagal melatih sama sekali. Dan jika rangkaian terlalu lunak, gambar apa pun akan dihasilkan menjadikan rangkaian tidak berguna.
  2. GAN gagal dalam menentukan kedudukan objek dari segi berapa kali objek itu mesti berlaku di lokasi tersebut.
  3. Perspektif 3-D menyusahkan GAN kerana tidak dapat memahami perspektif , selalunya akan memberikan gambar rata untuk objek 3-d.
  4. GAN mempunyai masalah memahami objek global . Ia tidak dapat membezakan atau memahami struktur holistik.
  5. Jenis GAN yang lebih baru lebih maju dan diharapkan dapat mengatasi kekurangan ini sama sekali.

Aplikasi Rangkaian Adversarial Generatif

Berikut adalah beberapa aplikasi GAN.

Ramalan Bingkai Seterusnya Dalam Sebuah Video

Ramalan peristiwa masa depan dalam bingkai video dimungkinkan dengan bantuan GAN. DVD-GAN atau Dual Video Discriminator GAN dapat menghasilkan 256 × 256 video kesetiaan terkenal sehingga panjang 48 bingkai. Ini dapat digunakan untuk pelbagai tujuan termasuk pengawasan di mana kita dapat menentukan aktiviti dalam kerangka yang terdistorsi kerana faktor lain seperti hujan, debu, asap, dll.

Teks ke Penjanaan Gambar

Objektif berdasarkan objek GAN (obj-GAN), melakukan sintesis teks-ke-gambar dalam dua langkah. Menghasilkan susun atur semantik adalah langkah awal dan kemudian menghasilkan gambar dengan mensintesis gambar dengan menggunakan penjana gambar de-konvolusional adalah langkah terakhir.

Ini dapat digunakan secara intensif untuk menghasilkan gambar dengan memahami kapsyen, tata letak dan memperincikan perincian dengan mensintesis kata-kata. Terdapat satu lagi kajian mengenai storyGAN yang dapat mensintesis keseluruhan papan cerita dari perenggan semata-mata.

Meningkatkan Resolusi Gambar

Rangkaian lawan generatif resolusi tinggi atau SRGAN adalah GAN yang dapat menghasilkan gambar resolusi tinggi dari gambar beresolusi rendah dengan perincian yang lebih baik dan berkualiti.

Aplikasi boleh menjadi sangat besar, bayangkan gambar berkualiti tinggi dengan perincian yang lebih baik dihasilkan dari gambar beresolusi rendah. Jumlah bantuan yang akan dihasilkannya untuk mengenal pasti perincian dalam gambar beresolusi rendah dapat digunakan untuk tujuan yang lebih luas termasuk pengawasan, dokumentasi, keamanan, pengesanan corak, dll.

Terjemahan Imej Ke Imej

Pix2Pix GAN adalah model yang direka untuk tujuan imej-terjemahan-imej umum.

Penjanaan Imej Interaktif

GAN boleh digunakan untuk menghasilkan gambar interaktif juga, Sains Komputer dan makmal kecerdasan buatan (CSAIL) telah mengembangkan GAN yang dapat menghasilkan model 3-D dengan pencahayaan dan pantulan realistik yang diaktifkan oleh penyuntingan bentuk dan tekstur.

apakah pemecahan baris dalam html

Baru-baru ini, para penyelidik telah menghasilkan model yang dapat mensintesis wajah yang dihidupkan kembali oleh pergerakan seseorang sambil mengekalkan penampilan wajah pada masa yang sama.

Ini membawa kita ke akhir artikel ini di mana kita telah belajar 'What Are GANs'. Saya harap anda jelas dengan semua yang telah dikongsi dengan anda dalam tutorial ini.

Sekiranya anda mendapati artikel ini mengenai 'Apa Itu GAN' yang relevan, lihat syarikat pembelajaran dalam talian yang dipercayai dengan rangkaian lebih daripada 250,000 pelajar berpuas hati yang tersebar di seluruh dunia.

Kami di sini untuk membantu anda dalam setiap langkah dalam perjalanan anda dan menyediakan kurikulum yang dirancang untuk pelajar dan profesional yang ingin menjadi . Kursus ini dirancang untuk memberi anda permulaan dalam pengaturcaraan Python dan melatih anda untuk konsep Python teras dan maju bersama dengan pelbagai suka

Sekiranya anda menjumpai sebarang pertanyaan, jangan ragu untuk mengajukan semua soalan anda di bahagian komen 'What Are GANs' dan pasukan kami dengan senang hati akan menjawabnya.