1つのクロールページをスクレイプした結果、2つのスクレイプのレコードが出来る場合があるんだけど
理解しました。クロールページごとに複数のスクレイプレコードが生成される可能性がある場合、それぞれのスクレイプレコードに一意な識別子が必要です。通常、これはデータベース内で自動的に生成されるプライマリーキーですが、場合によっては別の一意の識別子が必要な場合もあります。
この場合、クロール結果ごとに複数のスクレイプレコードが生成される可能性があるため、crawl_data_id をプライマリーキーとして使用することは適切ではありません。代わりに、クロールデータに対する一意な識別子を生成する必要があります。
そのためには、例えば以下のような方法が考えられます:
-
一意なクロールデータ識別子の生成: クロールデータに対して一意な識別子を生成し、それをスクレイプレコードの外部キーとして使用します。この識別子は、URLなどのクロールデータに関連する情報を使用して生成することができます。
-
複合キーの使用: クロールデータとスクレイプデータの組み合わせで一意な複合キーを生成し、それをスクレイプレコードのプライマリーキーとして使用します。この場合、クロールデータの
crawl_idとスクレイプデータの識別子などを組み合わせて一意なキーを生成します。
どちらの方法を選択するかは、データベース設計やアプリケーションの要件によって異なります。必要に応じて、データベースモデルを適切に調整してください。

ディスカッション
コメント一覧
まだ、コメントがありません