問題1
MLエンジニアは、遺伝的アルゴリズムに基づいてトレーニング済みのモデルをデプロイする必要があります。予測には数分かかる場合があり、リクエストには最大100MBのデータが含まれることがあります。
最も少ない運用オーバーヘッドでこれらの要件を満たす導入ソリューションはどれでしょうか?
MLエンジニアは、遺伝的アルゴリズムに基づいてトレーニング済みのモデルをデプロイする必要があります。予測には数分かかる場合があり、リクエストには最大100MBのデータが含まれることがあります。
最も少ない運用オーバーヘッドでこれらの要件を満たす導入ソリューションはどれでしょうか?
正確答案: C
說明:(僅 NewDumps 成員可見)
問題2
ある金融会社は、外部プロバイダーから大量のリアルタイム市場データストリームを受信しています。ストリームは毎秒数千件のJSONレコードで構成されています。
同社は、異常なデータポイントを識別するために、AWS 上にスケーラブルなソリューションを実装する必要があります。
最も少ない運用オーバーヘッドでこれらの要件を満たすソリューションはどれでしょうか?
ある金融会社は、外部プロバイダーから大量のリアルタイム市場データストリームを受信しています。ストリームは毎秒数千件のJSONレコードで構成されています。
同社は、異常なデータポイントを識別するために、AWS 上にスケーラブルなソリューションを実装する必要があります。
最も少ない運用オーバーヘッドでこれらの要件を満たすソリューションはどれでしょうか?
正確答案: B
說明:(僅 NewDumps 成員可見)
問題3
機械学習エンジニアは、Amazon SageMaker 上で機械学習モデルをトレーニングし、防爆型テレビ映像から自動車事故を検出しました。また、SageMaker Data Wrangler を使用して、事故画像と非事故画像のトレーニングデータセットを作成しました。
モデルはトレーニングと検証では良好なパフォーマンスを示しました。しかし、様々なカメラからの画像品質のばらつきにより、本番環境ではパフォーマンスが低下しています。
どのソリューションが最も短い時間でモデルの精度を向上させるでしょうか?
機械学習エンジニアは、Amazon SageMaker 上で機械学習モデルをトレーニングし、防爆型テレビ映像から自動車事故を検出しました。また、SageMaker Data Wrangler を使用して、事故画像と非事故画像のトレーニングデータセットを作成しました。
モデルはトレーニングと検証では良好なパフォーマンスを示しました。しかし、様々なカメラからの画像品質のばらつきにより、本番環境ではパフォーマンスが低下しています。
どのソリューションが最も短い時間でモデルの精度を向上させるでしょうか?
正確答案: B
說明:(僅 NewDumps 成員可見)
問題4
ある企業は、Amazon S3 に .csv ファイル形式で履歴データを保存しています。.csv ファイル内の一部の行と列にのみデータが入力されており、列にはラベルが付けられていません。企業がそのデータを使用して ML モデルのトレーニングを行えるよう、ML エンジニアはデータを準備して保存する必要があります。
このタスクを実行するには、以下のリストから正しい手順を選択し、順番に実行してください。各手順は1回だけ選択するか、まったく選択しないでください。(3つ選択して順番に実行してください。)
* データのクリーニングと機能エンジニアリングのための Amazon SageMaker バッチ変換ジョブを作成します。
* 結果のデータを Amazon S3 に保存します。
* Amazon Athena を使用してスキーマと利用可能な列を推測します。
* AWS Glue クローラーを使用して、スキーマと利用可能な列を推測します。
* データのクリーニングと機能エンジニアリングには AWS Glue DataBrew を使用します。

ある企業は、Amazon S3 に .csv ファイル形式で履歴データを保存しています。.csv ファイル内の一部の行と列にのみデータが入力されており、列にはラベルが付けられていません。企業がそのデータを使用して ML モデルのトレーニングを行えるよう、ML エンジニアはデータを準備して保存する必要があります。
このタスクを実行するには、以下のリストから正しい手順を選択し、順番に実行してください。各手順は1回だけ選択するか、まったく選択しないでください。(3つ選択して順番に実行してください。)
* データのクリーニングと機能エンジニアリングのための Amazon SageMaker バッチ変換ジョブを作成します。
* 結果のデータを Amazon S3 に保存します。
* Amazon Athena を使用してスキーマと利用可能な列を推測します。
* AWS Glue クローラーを使用して、スキーマと利用可能な列を推測します。
* データのクリーニングと機能エンジニアリングには AWS Glue DataBrew を使用します。

正確答案:

Explanation:
Step 1: Use AWS Glue crawlers to infer the schemas and available columns.
Step 2: Use AWS Glue DataBrew for data cleaning and feature engineering.
Step 3: Store the resulting data back in Amazon S3.
Step 1: Use AWS Glue Crawlers to Infer Schemas and Available Columns
Why? The data is stored in .csv files with unlabeled columns, and Glue Crawlers can scan the raw data in Amazon S3 to automatically infer the schema, including available columns, data types, and any missing or incomplete entries.
How? Configure AWS Glue Crawlers to point to the S3 bucket containing the .csv files, and run the crawler to extract metadata. The crawler creates a schema in the AWS Glue Data Catalog, which can then be used for subsequent transformations.
Step 2: Use AWS Glue DataBrew for Data Cleaning and Feature Engineering Why? Glue DataBrew is a visual data preparation tool that allows for comprehensive cleaning and transformation of data. It supports imputation of missing values, renaming columns, feature engineering, and more without requiring extensive coding.
How? Use Glue DataBrew to connect to the inferred schema from Step 1 and perform data cleaning and feature engineering tasks like filling in missing rows/columns, renaming unlabeled columns, and creating derived features.
Step 3: Store the Resulting Data Back in Amazon S3
Why? After cleaning and preparing the data, it needs to be saved back to Amazon S3 so that it can be used for training machine learning models.
How? Configure Glue DataBrew to export the cleaned data to a specific S3 bucket location. This ensures the processed data is readily accessible for ML workflows.
Order Summary:
Use AWS Glue crawlers to infer schemas and available columns.
Use AWS Glue DataBrew for data cleaning and feature engineering.
Store the resulting data back in Amazon S3.
This workflow ensures that the data is prepared efficiently for ML model training while leveraging AWS services for automation and scalability.
問題5
ある企業が、時系列データに基づいて将来の値を予測する機械学習モデルを開発しています。データセットには、定期的に収集された過去の測定値とカテゴリ特性が含まれています。このモデルは、過去のパターンと傾向に基づいて将来の値を予測する必要があります。
企業はモデルを開発するためにどのアルゴリズムとハイパーパラメータを使用すべきでしょうか?
ある企業が、時系列データに基づいて将来の値を予測する機械学習モデルを開発しています。データセットには、定期的に収集された過去の測定値とカテゴリ特性が含まれています。このモデルは、過去のパターンと傾向に基づいて将来の値を予測する必要があります。
企業はモデルを開発するためにどのアルゴリズムとハイパーパラメータを使用すべきでしょうか?
正確答案: C
說明:(僅 NewDumps 成員可見)
問題6
ある企業は、新規に作成されたVPCのパブリックサブネットでAmazon SageMakerドメインを運用しています。ネットワークは適切に構成されており、MLエンジニアはSageMakerドメインにアクセスできます。
最近、特定のIPアドレスからドメインへの不審なトラフィックを発見しました。当社は、特定のIPアドレスからのトラフィックをブロックする必要があります。
この要件を満たすネットワーク構成の更新はどれですか?
ある企業は、新規に作成されたVPCのパブリックサブネットでAmazon SageMakerドメインを運用しています。ネットワークは適切に構成されており、MLエンジニアはSageMakerドメインにアクセスできます。
最近、特定のIPアドレスからドメインへの不審なトラフィックを発見しました。当社は、特定のIPアドレスからのトラフィックをブロックする必要があります。
この要件を満たすネットワーク構成の更新はどれですか?
正確答案: B
說明:(僅 NewDumps 成員可見)
問題7
ある企業がAmazon Bedrock上で会話型AIアシスタントを構築しています。この企業は、社内の知識ベースを参照するために、検索拡張生成(RAG)技術を使用しています。このAIアシスタントは、Anthropic Claude 4 Foundation Model(FM)を使用しています。
同社には、ベクトル埋め込みモデル、ベクトルストア、ベクトル検索アルゴリズムを使用するソリューションが必要です。
最も少ない開発労力で AI アシスタントを開発できるソリューションはどれですか?
ある企業がAmazon Bedrock上で会話型AIアシスタントを構築しています。この企業は、社内の知識ベースを参照するために、検索拡張生成(RAG)技術を使用しています。このAIアシスタントは、Anthropic Claude 4 Foundation Model(FM)を使用しています。
同社には、ベクトル埋め込みモデル、ベクトルストア、ベクトル検索アルゴリズムを使用するソリューションが必要です。
最も少ない開発労力で AI アシスタントを開発できるソリューションはどれですか?
正確答案: C
說明:(僅 NewDumps 成員可見)
問題8
ML エンジニアは、サブスクリプション サービスの顧客離脱を予測するためのロジスティック回帰モデルを構築しています。
データセットには、location と job_seniority_level という 2 つの文字列変数が含まれています。
location 変数には 3 つの異なる値があり、job_seniority_level 変数には 10 を超える異なる値があります。
ML エンジニアは変数の前処理を実行する必要があります。
どのソリューションがこの要件を満たすでしょうか?
ML エンジニアは、サブスクリプション サービスの顧客離脱を予測するためのロジスティック回帰モデルを構築しています。
データセットには、location と job_seniority_level という 2 つの文字列変数が含まれています。
location 変数には 3 つの異なる値があり、job_seniority_level 変数には 10 を超える異なる値があります。
ML エンジニアは変数の前処理を実行する必要があります。
どのソリューションがこの要件を満たすでしょうか?
正確答案: D
說明:(僅 NewDumps 成員可見)
問題9
ある企業がエンタープライズAIプラットフォームを構築しています。本番環境向けのモデルをカタログ化し、モデルのバージョンを管理し、トレーニング指標などのメタデータをモデルに関連付ける必要があります。異なるバージョンのモデルを管理する負担を軽減する必要があります。
これらの要件を満たすソリューションはどれでしょうか?
ある企業がエンタープライズAIプラットフォームを構築しています。本番環境向けのモデルをカタログ化し、モデルのバージョンを管理し、トレーニング指標などのメタデータをモデルに関連付ける必要があります。異なるバージョンのモデルを管理する負担を軽減する必要があります。
これらの要件を満たすソリューションはどれでしょうか?
正確答案: B
說明:(僅 NewDumps 成員可見)
問題10
ある金融会社は、外部プロバイダーから大量のリアルタイム市場データストリームを受信しています。ストリームは毎秒数千件のJSONレコードで構成されています。
同社は異常なデータポイントを識別するために、AWS 上にスケーラブルなソリューションを実装する必要があります。
最も少ない運用オーバーヘッドでこれらの要件を満たすソリューションはどれでしょうか?
ある金融会社は、外部プロバイダーから大量のリアルタイム市場データストリームを受信しています。ストリームは毎秒数千件のJSONレコードで構成されています。
同社は異常なデータポイントを識別するために、AWS 上にスケーラブルなソリューションを実装する必要があります。
最も少ない運用オーバーヘッドでこれらの要件を満たすソリューションはどれでしょうか?
正確答案: B
說明:(僅 NewDumps 成員可見)
問題11
機械学習エンジニアがシンプルなニューラルネットワークモデルを学習させています。検証データセットを用いて、モデルのパフォーマンスを経時的に追跡しています。モデルのパフォーマンスは当初大幅に向上しますが、一定数のエポックを過ぎると低下します。
この問題を緩和する解決策はどれですか? (2 つ選択してください。)
機械学習エンジニアがシンプルなニューラルネットワークモデルを学習させています。検証データセットを用いて、モデルのパフォーマンスを経時的に追跡しています。モデルのパフォーマンスは当初大幅に向上しますが、一定数のエポックを過ぎると低下します。
この問題を緩和する解決策はどれですか? (2 つ選択してください。)
正確答案: A,E
說明:(僅 NewDumps 成員可見)
問題12
MLエンジニアは、1つのMLフレームワークを使用して複数のMLモデルをトレーニングします。MLエンジニアは推論コストを最適化し、Amazon SageMaker AIでモデルをホストする必要があります。
これらの要件を最もコスト効率よく満たすソリューションはどれでしょうか?
MLエンジニアは、1つのMLフレームワークを使用して複数のMLモデルをトレーニングします。MLエンジニアは推論コストを最適化し、Amazon SageMaker AIでモデルをホストする必要があります。
これらの要件を最もコスト効率よく満たすソリューションはどれでしょうか?
正確答案: B
說明:(僅 NewDumps 成員可見)
問題13
あるクレジットカード会社は、Amazon SageMaker エンドポイント上で不正検出モデルを本番稼働させています。同社はモデルの新バージョンを開発しており、本番環境のエンドユーザーに影響を与えることなく、ライブデータを使用して新モデルのパフォーマンスを評価する必要があります。
これらの要件を満たすソリューションはどれでしょうか?
あるクレジットカード会社は、Amazon SageMaker エンドポイント上で不正検出モデルを本番稼働させています。同社はモデルの新バージョンを開発しており、本番環境のエンドユーザーに影響を与えることなく、ライブデータを使用して新モデルのパフォーマンスを評価する必要があります。
これらの要件を満たすソリューションはどれでしょうか?
正確答案: A
說明:(僅 NewDumps 成員可見)
問題14
機械学習エンジニアは複数の機械学習モデルを評価しており、本番環境で使用するモデルを1つ選択する必要があります。これらのモデルによる偽陰性予測のコストは、偽陽性予測のコストよりもはるかに高くなります。
ML エンジニアがモデルを選択する際に最も優先すべきメトリックの検出は何ですか?
機械学習エンジニアは複数の機械学習モデルを評価しており、本番環境で使用するモデルを1つ選択する必要があります。これらのモデルによる偽陰性予測のコストは、偽陽性予測のコストよりもはるかに高くなります。
ML エンジニアがモデルを選択する際に最も優先すべきメトリックの検出は何ですか?
正確答案: B