Stable Diffusionは著作権を自分で保持できないよね。自分で保持できる生成AIないかな

2024年6月25日

生成AIの著作権問題については複雑で、多くの要素が関わってきます。特にStable Diffusionのようなモデルは、その訓練データが大規模な公開データセットであり、そのデータセットに含まれる個別の画像やテキストの著作権が絡むため、生成された画像の著作権を個人が完全に保持することは難しいとされています。

自分が著作権を保持できる生成AIを構築するためのアプローチとしては、以下の方法が考えられます：

完全に独自のデータセットでモデルを訓練する：
- 自分で撮影した写真や自分が作成したアート作品など、完全に著作権を自分が保持するデータを使ってモデルを訓練する。
- これにより、生成された画像の著作権はあなた自身にあります。
商用ライセンスのあるモデルを使用する：
- 商用利用が許可されている生成AIモデルを使用する。
- 例えば、一部の生成AIモデルやツールは、商用ライセンスを提供しており、それに従うことで生成物の商用利用が可能です。

以下に、独自のデータセットで訓練を行う際の基本的な流れを示します。具体的なモデルとして、GAN（Generative Adversarial Network）やVAE（Variational Autoencoder）などが考えられますが、ここでは簡単な例としてGANを用いた流れを示します。

独自のデータセットでGANを訓練する

データセットの準備：
- 自分で撮影した写真や作成したアート作品を収集し、データセットを作成します。
モデルの構築：
- TensorFlowやPyTorchなどのフレームワークを使ってGANモデルを構築します。
モデルの訓練：
- 構築したモデルを独自のデータセットで訓練します。
生成：
- 訓練済みモデルを使って画像を生成します。

以下は、PyTorchを使用したシンプルなGANの例です：

python
import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
import matplotlib.pyplot as plt

# データセットの準備
transform = transforms.Compose([
    transforms.Resize(64),
    transforms.CenterCrop(64),
    transforms.ToTensor(),
    transforms.Normalize([0.5], [0.5])
])

# 自分のデータセットパスに変更
dataset = datasets.ImageFolder('path/to/your/dataset', transform=transform)
dataloader = DataLoader(dataset, batch_size=128, shuffle=True)

# GANのモデル定義
class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        self.main = nn.Sequential(
            nn.ConvTranspose2d(100, 512, 4, 1, 0, bias=False),
            nn.BatchNorm2d(512),
            nn.ReLU(True),
            nn.ConvTranspose2d(512, 256, 4, 2, 1, bias=False),
            nn.BatchNorm2d(256),
            nn.ReLU(True),
            nn.ConvTranspose2d(256, 128, 4, 2, 1, bias=False),
            nn.BatchNorm2d(128),
            nn.ReLU(True),
            nn.ConvTranspose2d(128, 64, 4, 2, 1, bias=False),
            nn.BatchNorm2d(64),
            nn.ReLU(True),
            nn.ConvTranspose2d(64, 3, 4, 2, 1, bias=False),
            nn.Tanh()
        )

    def forward(self, input):
        return self.main(input)

class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.main = nn.Sequential(
            nn.Conv2d(3, 64, 4, 2, 1, bias=False),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Conv2d(64, 128, 4, 2, 1, bias=False),
            nn.BatchNorm2d(128),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Conv2d(128, 256, 4, 2, 1, bias=False),
            nn.BatchNorm2d(256),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Conv2d(256, 512, 4, 2, 1, bias=False),
            nn.BatchNorm2d(512),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Conv2d(512, 1, 4, 1, 0, bias=False),
            nn.Sigmoid()
        )

    def forward(self, input):
        return self.main(input)

# モデルの初期化
netG = Generator().cuda()
netD = Discriminator().cuda()

criterion = nn.BCELoss()
optimizerD = optim.Adam(netD.parameters(), lr=0.0002, betas=(0.5, 0.999))
optimizerG = optim.Adam(netG.parameters(), lr=0.0002, betas=(0.5, 0.999))

# 訓練ループ
num_epochs = 25
for epoch in range(num_epochs):
    for i, data in enumerate(dataloader, 0):
        # 1. Discriminatorの訓練
        netD.zero_grad()
        real = data[0].cuda()
        batch_size = real.size(0)
        label = torch.full((batch_size,), 1, dtype=torch.float, device='cuda')
        output = netD(real).view(-1)
        errD_real = criterion(output, label)
        errD_real.backward()
        D_x = output.mean().item()

        noise = torch.randn(batch_size, 100, 1, 1, device='cuda')
        fake = netG(noise)
        label.fill_(0)
        output = netD(fake.detach()).view(-1)
        errD_fake = criterion(output, label)
        errD_fake.backward()
        D_G_z1 = output.mean().item()
        errD = errD_real + errD_fake
        optimizerD.step()

        # 2. Generatorの訓練
        netG.zero_grad()
        label.fill_(1)
        output = netD(fake).view(-1)
        errG = criterion(output, label)
        errG.backward()
        D_G_z2 = output.mean().item()
        optimizerG.step()

        if i % 50 == 0:
            print(f'Epoch [{epoch+1}/{num_epochs}] Step [{i}/{len(dataloader)}] Loss_D: {errD.item()} Loss_G: {errG.item()} D(x): {D_x} D(G(z)): {D_G_z1}/{D_G_z2}')

    # 生成画像の表示
    with torch.no_grad():
        fake = netG(noise).detach().cpu()
    plt.figure(figsize=(10,10))
    plt.axis("off")
    plt.title("Generated Images")
    plt.imshow(np.transpose(fake[0], (1,2,0)))
    plt.show()

このコードの要点：

データセットの準備：独自の画像データセットを用意し、そのパスを指定します。
モデルの構築：シンプルなGeneratorとDiscriminatorを定義します。
訓練ループ：GANの訓練ループを実装し、各エポックごとに生成された画像を表示します。

この方法により、生成された画像の著作権はあなたに帰属することになります。

未分類

Posted by ぼっち