Vertica Blog

Vertica Blog

Japanese Checklists

Verticaのアップグレード方法

Verticaは、すべてのリリースで、新しい機能を追加し既存の機能を強化します。新機能あるいは改良された機能を使用するには、Verticaを最新リリースにアップグレードしてください。 前提条件 アップグレードする前に、次の手順を実行します。 データベースのフルバックアップを実行します。アップグレードが成功しなかった場合、フルバックアップで現在のバージョンにロールバックすることができます。ハードリンクでのバックアップの取得を検討可能です。ディスク障害が発生すると、バックアップが破損することに注意してください。 新しいバージョンのプラットフォーム要件を確認します。 カタログ用のストレージスペースを確認します。 HDFSコネクタをアンインストールします(Vertica 7.2.xより前のバージョンからアップグレードする場合のみ必要です)。 vertica-R-langなどのVerticaサーバーパッケージと依存関係のあるものについても、アンインストールを実施します。 最高のパフォーマンス結果を得るために、すぐに次のバージョンにアップグレードすることをご推奨します。 例:次の増分バージョンのVerticaにアップグレードします。たとえば、7.1から7.2または8.0から8.1にアップグレードします。詳細については、Vertica Documentation の を参照してください。 これらのタスクの完了後、データベースをシャットダウンし、次の手順を実行します。 ステップ タスク 結果 1 既存のデータベースの完全なローカルバックアップを取得し、データベースを停止します。 バックアップが成功した場合、 に進みます。 バックアップが失敗した場合、Vertica Documentation の を参照してください。 2 各ホストにインストールした追加のパッケージをアンインストールします。 この手順を省略し、追加のパッケージをアンインストールしない場合、次のステップでVerticaサーバーパッケージのインストールに失敗します。 アンインストールが成功した場合、 に進みます。 アンインストールが失敗した場合、エラーを確認し、Verticaテクニカルサポートまでお問い合わせください。 3 任意のホストに新しいVerticaサーバーパッケージをrootまたはsudoでインストールします。 1つのノードまたはすべてのノードにインストールできます。1つのノード上にインストールした場合、install_verticaスクリプトが他のノードに順番にインストールします。すべてのノード上に同時にインストールした場合、スクリプトがrpmをコピーする必要がないため、install_verticaスクリプトの実行が高速になります。 インストールが成功した場合、 に進みます。 インストールが失敗した場合、エラーを確認し、Verticaテクニカルサポートまでお問い合わせください。 4 次のサンプルコマンドのように、update_verticaスクリプトをrootまたはsudoで実行します。 更新が成功した場合、 に進みます。 5 データベースを起動します。 データベースが起動すると、 に進みます。 6 クラスターでVerticaサーバーパッケージをアップグレードした後、クライアント認証をアップグレードします。 a. CLIENT_AUTH、CLIENT_AUTH_PARAMSおよびUSER_CLIENT_AUTHシステムテーブルを照会して、アップグレード中にVerticaが作成したクライアント認証方法を確認します。 b. vertica.logファイルを確認します。 c. CREATE AUTHENTICATIONで必要なレコードを作成します。...

新規ノードをクラスターに追加する場合の対処方法

より多くのストレージを必要としますか?追加のストレージが必要な場合、データベースにノードを追加することを検討してください。新しいノードは、すべて同時に追加することをご推奨します。 このチェックリストを使用して、ノードを追加することができます。これらは基本的なステップです。 には、追加のオプションが掲載されています。 ステップ タスク 結果 1 既存のデータベースの完全なローカルバックアップを取得します。 デフォルトでは、進行状況バー以外の出力は表示されません。追加の進行状況情報を含めるには、1-3の間の値が指定可能な「--debugオプション」を使用します。 バックアップユーティリティを実行している際にconfigファイルを指定します。 ファイルが存在しない場合、バックアップはエラーで失敗します。エラーを解決し、 に進みます。 2 古い、あるいは、未使用のテーブルパーティションを削除します。 テーブルパーティションが削除された場合、 に進みます。 テーブルパーティションが削除されていない場合、テーブル名とパーティションの値を確認して、もう一度やり直してください。 3 ローカルセグメンテーションが無効であることを確認します。無効になっていない場合、無効にします。 ローカルセグメンテーションが無効になっていることを確認後、 に進みます。 4 クラスターのネットワーク帯域幅とCPUパフォーマンスを確認します。 ノード間のネットワークのレイテンシとスループットを測定し、ハードドライブの速度を測定します。 レイテンシとスループットが初期ベンチマークよりも低い場合、システム管理者に連絡し、性能劣化の問題を解決してください。 5 リバランスを実行するのに十分なストレージ(データベースのサイズの少なくとも40%)があるかどうかを確認します。 各ノードのスナップショットを取得するには、HOST_RESOURCESシステムテーブルの次のフィールドを確認します。 各ノードのディスクストレージの容量がリバランスを実行するのに十分であることを確認します。十分である場合、に進みます。 ストレージがない場合、カタログサイズを縮小してください。詳細については、チェックリストを参照してください。 6 リバランス対象のテーブルのDML処理を最小限に抑えます。リバランスがテーブルをロックしている場合、ロードは失敗します。 リバランスがETLジョブと競合する可能性がある場合、構成パラメーターLockTimeoutの値を増やします。 進行中のDML処理を対処後、に進みます。 デフォルト値は300秒(5分)です。 7 データベースを停止します。 データベース停止後、に進みます。 8 update_verticaスクリプトを使用して、ホストを構成し、ホストをクラスターに追加します。 a. update_verticaスクリプトを使用して、ホストを追加します。 b. データベースにノードを追加します。 「-sオプション」を使用すると、追加するノードの順序を指定できます。 ノードをデータベースに追加後、Verticaは更新された構成ファイルをクラスタ内ーの他のノードに自動的に分配し、クラスター内のデータのリバランスプロセスを開始します。 ホストとノードの追加後、 に進みます。 9 個々のテーブルのリバランスの進捗状況をモニタリングできます。 モニタリング実施後、 に進みます。 10 リバランスが正常に完了したかどうかを確認します。 「operation_status = COMPLETE」の場合、リバランスはエラーなく完了したことを意味します。 クラスター内のすべてのノードがエラーなくリバランスされている場合、このチェックリストは完了です。 リバランスが正常に完了しなかった場合、Verticaテクニカルサポートまでお問い合わせください。 関連詳細情報...

AHM(Ancient History Mark)が進まない場合の対処方法

AHMが進んでいない場合、次のチェックリストを使用してトラブルシューティングを行います。 ステップ タスク 結果 1 Last Good Epoch(LGE)が進んでいるかどうかを確認します。 LGEが進んでいる場合、 へ。 LGEが進んでいない場合、 へ。 2 すべてのノードがUPしているかどうかを確認します。 すべてのノードがUPの場合、 へ。 1つ以上のノードがDOWNの場合、下記コマンドを使用してすべてのノードをUPにします。 すべてのノードがUPになった後、 へ。 3 リフレッシュが実行されていないプロジェクションがないかどうか確認します。 1つ以上のプロジェクションが「IS_UP_TO_DATE = f」となっている場合、次のいずれかを実行します。 プロジェクションの削除 プロジェクションのリフレッシュ 4 AHMは進みましたか? AHMが進んでいる場合、チェックリストは完了です。 AHMが進んでいない場合、このチェックリストを再度開始して、別のパスを探します。AHMが進まない場合、Verticaテクニカルサポートまでお問い合わせください。 5 WOS上にデータがないかどうか確認します。 WOS上にデータがある場合、MOVEOUTを手動実行します。 WOS上にデータがない場合、 へ。 6 LGEが他のノードよりも古いノードを確認します。 任意のノードのLGEが別のノードのLGEよりも古い場合、 へ。 すべてのノードが同じLGEである場合、Verticaテクニカルサポートまでお問い合わせください。 7 Moveoutが実行中で、moveout処理がreplay deleteで遅延していないことを確認します。 Moveoutが実行され、AHMが進んでいる場合、 このチェックリストは完了です。Moveoutが実行されていない場合、Verticaテクニカルサポートまでお問い合わせください。 関連詳細情報 の   をご参照ください。

メンテナンスのためにVerticaノード停止する場合の対処方法

メンテナンスのためにVerticaノードをシャットダウンする必要がある場合、このチェックリストが役立ちます。 ステップ タスク 結果 1 すべてのノードがUPであることを確認します。 シャットダウン後の長時間にわたるノードリカバリを避けるには、1つ以上のノードが停止している場合、 内の説明にしたがって、なるべく早く検知し、再起動します。 2 ノードを再起動できない場合、 AHMが長い間進んでいないかどうか確認します。 デリートベクター数を確認します。 AHMが長時間保持されていて、デリートベクター数が多く、また、複数のテーブルにまたがっている場合、ノードリカバリが遅延する可能性があります。 この場合、ノードリカバリのチェックリスト内の手順に従います。 次の内容があてはまるとします。 データの3%以上に影響を与える削除や更新を行っています。 ノードが長い間停止しています。 多くの更新と削除を行うステージングテーブルがある場合、ノードをリカバリする前にテーブルを削除します。 最後の選択肢は、次のコマンドでAHMを強制的に進めることです。 続いて、停止ノードをリカバリすると、Verticaはバディーノードからデータをコピーすることによって、そのノードを初期状態からリカバリします。 3 ノードの依存関係を確認します。 想定するノード依存関係の場合、(ノードの数 + 1)行をリストします。 ノードの依存関係が正しい場合、 へ。 ノードの依存関係が正しくない場合、クラスター内のデータをリバランスします。 クラスターで再度リバランスを実行してもノードの依存関係が正しくない場合、Verticaテクニカルサポートまでお問い合わせください。 4 データの損失を避けるために、データベースをバックアップします。 より詳細な情報については、 をご確認ください。 に記載があるように、ハードリンクのバックアップを使用して、バックアップ処理をスピードアップすることを検討してください。 バックアップが成功した場合、 へ。 バックアップが完了しない場合、データベースが停止している場合は、コールドバックアップまたはオフラインバックアップを実行します。 これを行うには、カタログディレクトリとデータディレクトリを別の場所にコピーします。 Vertica 7.2.xおよびそれ以前の場合: Vertica 8.0.x以降の場合: 5 データベースをシャットダウンする準備をします。 a. セッションの最大数の設定内容を表示します。 追加でユーザーがデータベースに接続できないようにするには、MaxClientSessionsを0に設定します。 注意: MaxClientSessions = 0 としても、dbadminセッションを5つまでは許可します。 b. シャットダウン処理は、Tuple Moverを実行します。ただし、シャットダウン処理をコントロールするために、Tuple Moverを手動で実行して、WOSからROSへすべてのプロジェクションのデータを移動します。 テーブル名を省略した場合、Tuple MoverはWOS上のすべてのデータを移動します。 c....

ノードのリカバリ処理遅延の対処方法

7.2.x以降を使用している場合、テーブルごとにリカバリを実行してください。詳細については、Vertica Documentation の  を参照ください。 7.1.xより前のVerticaバージョンを使用している場合、ETLジョブ等の更新処理を行う処理を停止してノードリカバリを再開してください。 ステップ タスク 結果 1 リカバリの進捗状況をモニターします。 「is_running = f」 の場合、リカバリは完了しています。 このステートメントを繰り返し実行し、current_completedの値が増加しているかどうかを確認します。増加している場合、リカバリが進行中であることを意味します。 リカバリは進行中ですか? リカバリが進行していない場合、 へ。 リカバリが進行している、あるいは、終了している場合、 へ。 2 ノードリカバリは正常に完了しましたか? 正常に完了している場合、チェックリストは完了です。 正常に完了しておらず、リカバリがエラーで終了している場合、 へ。 3 リカバリは予想よりも遅いですか? 遅くない場合、 へ。 遅い場合、次の内容を実施します。 iostatを使用し、ディスクI/Oをチェックします。問題がある場合、ディスクI/Oスケジューラをdeadline(HDDの場合)あるいはnoop(SSDの場合)に変更します。 同時に実行されているクエリの数が最大数、あるいはそれに近いかどうかを確認します。 「max_concurrency = running_query_count」の場合、クエリのロードが非常に高いと言えます。 a. MAXCONCURRENCY の増加 b. リカバリの再開 c.  へ 4 リカバリは特定のテーブルでとまっているように見えますか? 特定のテーブルでとまっていない場合、 へ。 特定のテーブルでとまっている場合、ノードがリカバリ中であるかどうか確認します。 「node_state=RECOVERING」の場合、ノードリカバリが進行中であることが分かります。 5 ノードがリカバリのHistoricalフェーズにあるかどうかを確認します。 「historical_completed」の値が、「historical_total」の値よりも小さい場合、ノードはHistoricalフェーズにあるといえます。Verticaがストレージコンテナを隣接ノードからコピーしているフェーズとなります。 「historical_complete = historical_total」の状態となるまで、左記のステートメントを繰り返し実行します。 VerticaがリカバリのHistoricalフェーズの状態である場合、完了するのを待つ必要があります。 6 トランザクションが、replay deleteの処理で滞っていますか? Replay deleteの処理で滞っていない場合、 へ。...

ノードがSpreadに接続できなくなった場合の対処方法

ノードがSpreadに接続されていない場合、次のチェックリストを使用してトラブルシューティングを行います。 ステップ タスク 結果 1 カタログフォルダ内のspread.confファイルが、クラスター内のすべてのノードで同一であるかどうかを確認します。 spread.confファイルがすべてのノードで同一の場合、  へ。 すべてのノードでspread.confファイルが同一でない場合、次の手順を実施します。 正しいspread.confファイルを確認します。ファイルには、すべてのクラスターノードのIPアドレスが含まれているはずです。 正しいspread.confファイルをscpを使用してすべてのノードにコピーします。 2 spreadのポート(デフォルトは4803)が次のいずれかを使用してリスニングしているかどうかを確認します。 もしくは クラスター内の各ノードには、それぞれのspreadのポートがあります。クラスター内のspreadによって使用されるポートを確認するには、次の手順を実行します。 /database_catalog_directory/spread.conf 内で確認する。 「Spread_Segment 192.168.40.255:4803」のようなSpread_Segmentの行のIPの後の内容(この場合、4803)を確認する。 spreadがリスニングしていない場合、 へ。 spreadがリスニングしている場合、 へ。 3 ファイアウォールが有効になっていないことを確認します。 ファイアウォールが有効になっている場合、ファイアウォールを無効にするか、ネットワーク管理者にポートを開くように依頼してください。 4 /etc/hosts ファイルにクラスターのすべてのIPアドレスが含まれているかどうかを確認します。 ファイルがクラスターのすべてのIPアドレスを含んでいて正しい内容の場合、 へ。 ファイルが正しくない場合、クラスター内のすべてのノードを含めるように/etc/hostsファイルを修正し、 へ。 5 UDP受信パケットにエラーが含まれていないかどうかを確認します。 UDP受信パケットにエラーが含まれる場合、該当システムのシステム管理者に相談して問題を解決してください。 UDP受信パケットにエラーが含まれていない場合、 へ。 6 spuserを使用して、spreadのグループが形成されているかどうかを確認します。 a. クラスター内のすべてのノード上で次のコマンドを実行します。 b. 次のコマンドを実行します。 c. 前の手順で見つかったメンバーの数がノードの数と一致することを確認します。 ノードの数が一致する場合、spreadは接続されているはずであり、チェックリストは完了です。 ノードの数が一致しない場合、このチェックリストを再度たどって、別のパスを探します。 メンバーの数が継続してノードの数と一致しない場合、Verticaテクニカルサポートまでお問い合わせください。 関連詳細情報 の  や、の  で詳細情報が確認できます。

リバランス処理遅延の対処方法

Verticaクラスターにノードを追加したり、クラスターからノードを削除したりすると、Verticaはすべてのノード上でデータのリバランスを実施します。リバランスに長時間を要する場合、これらの手順を参照して原因を調べます。 前提条件 リバランスを開始する前に、クラスターの正常なリバランスを確実に行うために、以下のステップを実行してください。 1. ETLジョブと競合しない時間帯にリバランスをスケジューリングします。 2. データベースをバックアップします。 3. 古い、あるいは、未使用のテーブルパーティションを削除します。 4. ローカルセグメンテーションが無効であることを確認します。ローカルセグメンテーションが無効になっていない場合、このコマンドを実行して無効にします。 5. vioperfとvnetperfを使用して、CPUとネットワークの帯域幅をそれぞれ確認します。 使用可能な帯域幅が初期ベンチマークの値よりも小さい場合、システム管理者に連絡して、性能が低下している原因となる問題を見つけて修正してください。 6. リバランスを実行するために、データベースのサイズの少なくとも40%のストレージが使用可能であるかどうかを確認します。ストレージの使用状況を確認するには、次のクエリを実行します。 Linuxファイルシステムで使用可能なディスク容量を確認します。 HOST_RESOURCESシステムテーブルから各ノードのスナップショットを取得します。 ストレージが不足している場合、カタログサイズを縮小するための手順を実行してください。 不要なデータ、一時的なデータ、ステージングデータを削除する。 ログファイルをクリーンアップする。 不要なテーブルまたはパーティションを削除する。 新しいドライブを追加し、ストレージのロケーションを追加し、一部のカタログオブジェクトを新しいロケーションに移行する。 リバランスの間に使用される一時スペース用の一時格納領域を追加する。 ビルトインのREFRESHリソースプールの設定を確認します。 必要に応じて、リバランス処理が滞りなく実行できるように、リソースプール設定を調整します。 7. リバランス対象のテーブルに対するDML処理(COPY、INSERT、UPDATE、DELETE)を最小限に抑えます。リバランスがテーブルのロックを保持している場合、ロードは失敗します。ロードがテーブルをロックしている場合、リバランスは一時停止します。 リバランスがETLジョブと競合していると考えられる場合、LockTimeout値を増やしてください。デフォルト値は、300秒(5分)です。 8.  の説明にしたがって、DeleteされたデータをPurgeします。 9. クラスターに追加するホストを構成します。 10. ホストをクラスターに追加します。 11. データベースにノードを追加します。 注意:詳細については、 を参照してください。 12. リバランスを途切れることなく実行するには、DMLCancelTMパラメーターをfalseに設定して、リバランスプロセスを優先します。 これで、リバランス処理を開始する準備が整いました。ここでは、リバランスを開始し、プロセスが正常に完了するのをモニタリングするための手順を示します。  の説明に従って、リバランスを開始します。 ステップ タスク 結果 1 Verticaがリバランスを実行しているテーブルをモニタリングします。 このクエリは、Verticaがリバランス実行しているテーブルと、転送されたデータの量に関する情報を返します。 2 DML処理またはDDL処理で特定のテーブルのリバランスが妨げられた場合、次のようなエラーメッセージが表示されます。 このエラーが表示された場合、DML処理またはDDL処理を停止し、リバランスを再開してください。 あるいは、これらの処理が実行されない時間帯までリバランスを延期します。 3 次のシステムテーブルをモニタリングして、個々のテーブルとプロジェクションの進捗状況を確認します。...

ストレージにアクセスできずVerticaが起動できない場合の対処方法

データベースホストがまだ稼働中で、電源がオンの場合、Verticaストレージにアクセスできなくなることがあります。Verticaが停止している可能性があり、データやカタログのディスクボリュームが使用できません。 次のチェックリストを使用してトラブルシューティングを行います。 ステップ タスク 結果 1 ホストが再起動した際に、ファイルシステムの自動マウントに問題はありましたか? 問題があった場合、 手動でそれらをマウントします。 /etc/fstabにエントリーを追加して、次のサーバーのブート時に自動マウントするようにします。 Linuxのログで、ディスクの障害やエラーの可能性があるかどうかを確認します 問題がなかった場合、 へ。 2 ハードウェアまたはディスクの障害のために、1つあるいは複数のディスクがオフラインになっていますか? 該当する場合、RAIDセットとハードウェアコントローラーでエラーとメッセージを確認してください。複数のディスク障害がないかチェックします。 該当しない場合、 へ。 3 ハードウェアのRAID保護の設定、たとえば、RAID 0となっているなど、設定が間違っていないですか? 間違っている場合、ハードウェアRAID保護の設定、RAID 1+0またはRAID 5を使用してRAIDセットを再構築します。 障害が発生したホストのデータは、K-safetyがデータベースに設定されている場合にのみ、別のVerticaホストから復元できます。 間違っていない場合、 へ。 4 ディスクボリュームの修復が必要ですか? 修復が必要な場合、fsckを実行します。 修復が必要でない場合、 へ。 5 もっと情報が必要ですか? 情報が必要な場合、 追加情報とエラーについては、/var/log/messagesを確認します。 製造元のディスクユーティリティ(ハードウェアコンソール)をチェックして、構成を検証し、エラーを確認します。 情報が必要でない場合、 へ。 6 ディスクエラーのためにディスクが「読み取り専用」でマウントされていますか? 該当する場合、システム上のデータ保護が有効化されています。Verticaは、読み取り専用のファイルシステムを持つホスト上では起動せず、失敗します。 ディスクを再マウントするか、読み取り専用のファイルシステムの原因となるエラーを修正してください。 該当しない場合、Verticaテクニカルサポートまでお問い合わせください。 関連詳細情報  の  をご参照ください。

Verticaホストが遅延している場合の対処方法

状況: 応答時間が遅い サーバーはCPU負荷が高く、プロセスが多すぎる ホストがハングしている可能性があり、接続できない、あるいは、接続がハングしている可能性がある 考えうる原因: 利用可能なメモリが少ない 実行中の同時実行プロセスが多すぎる サーバーがスワップ領域を積極的に使用している 次のチェックリストを使用してトラブルシューティングを行います。 ステップ タスク 結果 1 Vertica以外のプロセスまたはアプリケーションが実行されているかどうかを確認します。 ホストの稼働時間を確認するか、Linuxコマンドを使用して、プロセス、メモリ使用量、およびCPU稼動のリストを表示します。 uptimeの結果は、それぞれ直近の1分、5分、15分のシステムの平均負荷を表しています。 サーバーのアクティビティを表示するその他のコマンドは次の通りです。 top コマンドは、詳細なリアルタイムCPUアクティビティ、メモリ使用量、および現在実行中のプロセスの詳細を表示します。 Vertica以外のプロセスまたはアプリケーションが実行されている場合、可能であれば、それらのプロセスを他のサーバーに移動してVerticaデータベースホストへの影響を減らします。 該当しない場合、 へ。 2 メモリが少なく、スワップ領域を積極的に使用しているかどうかを確認します。 2a. top コマンドを使用して、使用可能なメモリーとスワップ領域の使用状況を表示します。top コマンドの出力により、メモリの使用状況が、以下のように表示されます。 2b. 認識されている総メモリ(16,333,388k)と使用メモリ量(4,355,992k)を確認できます。 スワップの使用領域は、例のように0である必要があります。 スワップの使用領域の値が0以外の場合、スワップ動作を意味し、ホストの低速応答の考えうる原因の1つとなりえます。 個々のプロセスの場合、top コマンドは各プロセスのメモリ使用量を返します。 この内容が、誤って構成されたアプリケーションを識別するのに役立ちます。 スワップの使用領域が0の場合、 このホスト上で実行中のワークロードを評価し、同じクラスター内の他のVerticaホストと比較します。 ワークロードとユーザー接続のバランスを取ります。 ハードウェア構成とメモリサイズを確認します。 他のアプリケーションがVerticaホスト上でメモリを消費していないか確認します。それらを他のサーバーに移動することを検討してください。 2c. 各Verticaホストで、vm.swappiness の値を1に設定します。 デフォルト値は60です。というのも、システムがスワップディスク上のスペースを容易に使用するためです。 値が1の場合、ディスクへのスワップを最小限におさえます。 rootで、値を1に変更します。 vm.swappiness の値が1の場合、 へ。 2d. 設定を確認します。 3 セキュリティおよびオペレーティングシステムのパッチが最新のものかどうかを確認します。オペレーティングシステムのパッチは、yum コマンドを使用してインストールできます。 3a. 最新のパッチをダウンロードしてインストールするには、次のコマンドを実行します。 3b. 特定のパッケージ、たとえば最新のセキュリティ更新プログラムを表示するには、次のコマンドを実行します。...
Three 3D arrows, different colors pointing in different directions

Verticaホストが停止している場合の対処方法

このチェックリストでは、Verticaクラスターの各メンバーをホストと呼びます。 Verticaプロセスは、クラスター内の他のVerticaノードと通信します。ノードは、Verticaデータベースソフトウェアを参照します。 ホストが停止している場合、次のチェックリストを使用してトラブルシューティングを行います。 ステップ タスク 結果 1 Verticaホストが物理的に電源オフになっています。サーバーの前面に、ステータスのライトがありません。 電源まわりで問題はありますか? チェックすべき項目: サーバーの電源障害 UPSバッテリー サイトの停電 ラックの電源障害 問題がある場合、各コンポーネントの障害のためにホストの電源がオフになっていることが考えられます。  に進み、停電の原因を特定し、解決します。 2 次のようなハードウェアのいずれかが原因でホストがクラッシュしましたか? ディスク、あるいは、ディスクコントローラー CPU メモリ ネットワークアダプター 該当する場合、問題を解決してください。その後、 へ。 該当しない場合、 へ。 3 次のいずれかが原因の温度過熱の問題はありますか? 十分な冷却が足りておらず、その結果、高温状態でシャットダウンが発生 データセンターの冷却問題 ラック内の通気不足 換気の遮断 問題がある場合、該当する問題を解決してください。その後、 へ。 問題がない場合、 へ。 4 既知のクラッシュまたは障害の時刻を記録します。 で記録された障害の発生時刻を使用して、クラッシュの根本原因を特定します。 5 の障害発生時刻を使用して、次のログファイルで障害とその原因を確認します。 ブートログ:/var/log/boot.log Linuxログ(通常のシャットダウン、電源オフ、ハードウェア障害):/var/log/messages ハードウェアコンソールログ。コンソールマネージャーからログを確認 これらのログファイルの情報は、障害の原因を特定するのに役立ちます。 将来の障害を防ぐために、問題解決にあたります。 問題を解決するために必要に応じてVerticaテクニカルサポートまでお問い合わせください。 6 問題が解決したら、ホストを再起動します。 ホストはエラーなしで起動する必要があります。 すべてのデバイスが利用可能になるはずです。 ファイルシステムをマウントする必要があります。 ネットワーク接続が正しく機能するはずです。 関連詳細情報 の ...

Verticaホストのネットワーク接続に問題がある場合の対処方法

Verticaホストが物理的に利用できる状態で、オペレーティングシステムが稼動していてもVerticaクラスターへのネットワークにアクセスできない場合、外部からの接続ができないことが考えられます。クライアントソフトウェアの接続に失敗し、ユーザーはホストにsshできない状態で、ハードウェアのコンソール接続を確認すると、ホストがまだ稼動しているように見えるとします。 次のような問題が存在しないかどうかを確認します。 ステップ タスク 結果 1 NETWORK_USAGEシステムテーブルから初期情報を取得します。 NETWORK_USAGEシステムテーブルに関する情報を取得したら、 に進みます。 2 デフォルトのルートIPアドレス、あるいは、ルーターアドレスにpingする際に問題がありますか? 問題がある場合、ルーターはダウンしているか、または誤って構成されています。ルーターを再設定して再起動してください。該当システムのネットワーク管理者に相談してください。 問題がない場合、 へ。 3 ファイアウォールが有効になっていますか? 有効になっている場合、ファイアウォールを無効にして設定を確認し、 へ。 有効になっていない場合、設定を確認し、 へ。 4 ファイアウォール設定がVerticaが必要とするポートをブロックしていますか? デフォルト設定を使用し、Verticaが必要とするポートをブロックすると、ファイアウォールの問題が発生することがあります。 ポートをブロックしている場合、次のコマンドを実行してファイアウォールを無効にします。 ポートをブロックしていない場合、 へ。 5 使用中のネットワークポートを確認します。 Verticaでは、次のネットワークポートが必要となります。 22 TCP:管理ツール 5433 TCP/UDP:Verticaクライアント(vsql, ODBC, JDBC など) 5434 TCP:クラスター内通信 5444 TCP:Verticaマネージメントコンソール 5450 TCP:Verticaマネージメントコンソールウェブアクセス 4803 TCP:Spreadクライアント接続 4803 UDP:Spreadデーモン間接続 4804 UDP:Spreadデーモン間接続 6543 UDP:デーモン接続に対するSpreadモニター 一部のポートがブロックされている場合、Verticaが必要とするポートの一覧とファイアウォール上でオープンしているポートを確認します。 ポートのブロックに問題ない場合、 へ。 6 DNS設定エラーが発生しましたか? エラーが発生している場合、 ホスト名の代わりにIPアドレスを使用してみてください。 pingコマンドを使用して接続を確認します。host.domain名、あるいは、IPアドレスを使用します。 エラーが発生していない場合、 へ。...

クエリの性能が突然低下した場合の対処方法

以前は高速で実行されていたクエリの実行が遅くなり始めましたか? 次のチェックリストを使用し、以前は高速に実行されていたクエリの性能が突然低下した原因を調べます。 ステップ タスク 結果 1 次のコマンドを使用して、ホストのエラーメッセージを確認します。 $ dmesg クラスターの状態が良好な場合、 へ。 クラスターの状態が良好でなく、エラーメッセージが表示された場合は、システム管理者に連絡してください。 サーバー上の問題が解決したら、このチェックリストの次に進みます。 2 次のコマンドを使用して、全ノードのクラスター設定を確認します。 クラスターが正しく設定されていない場合、Verticaのドキュメントへのリンクを含むエラーのリストを表示します。リンク先の内容を確認し、エラーを解決してください。 エラーが表示されない場合、 へ。 3 クラスターの状態を確認する前にデータベースを停止します。 データベースが正常に停止した場合、 へ。 それ以外の場合、検証スクリプトを実行し、 へ。 4 クラスターのネットワーク性能を確認します。 ディスクI/Oの性能を確認します。 CPUの性能を確認します。 ネットワーク、ディスクI/O、およびCPUのパフォーマンスの結果を調べ、 へ。 5 EXPLAINステートメント、あるいは、EXPLAIN LOCAL VERBOSEステートメントを実行し、出力結果を確認し、異常である可能性がある点を特定します。 統計情報が不足しているというメッセージが表示された場合、 へ。 期待される結合順序で表示されない場合、 へ。 現在のプランと古いプランを比較することで、実行計画の変更を確認できます。新しいプランが以前より悪くなっている場合、Verticaテクニカルサポートまでお問い合わせください。古いプランが確認できない、あるいは、異常が見られない場合、 へ。 6 次のコマンドを使用して、EXPLAINで確認した実行計画の内容から、統計情報が欠落していると判別したテーブルに対して、統計情報を更新します。 統計取得が完了したら、Step 5を繰り返し、計画が変更されているか、あるいは、異常がある可能性がある別の点が発生していないかどうかを確認します。 詳細情報については、Verticaドキュメントの  を参照ください。 7 新しい結合順序がより効率的である場合、Verticaはクエリを分析してクエリの結合順序を変更します。 クエリの結合順序が変更されている場合、SYNTACTIC_JOINヒントを使用して結合順序を強制できます。ヒントは結合順序を強制し、他の結合のヒントを有効にします。 クエリオプティマイザーのヒントを使用して、クエリのパフォーマンスを向上させる必要がある場合、Verticaテクニカルサポートにお問い合わせいただき、以前より悪くなっている点について報告してください。 8 リアルタイムでプロファイリングすることにより、実行中の長時間実行クエリをモニターすることができます。 クエリ性能の劣化原因を特定するために、クエリをプロファイルしてください。クエリ実行のプロファイリングについてのより詳細な情報については、Vertica Knowledge Baseの  を参照してください。 クエリの性能が向上した場合、このチェックリストは完了です。 クエリの性能が向上しない場合、Verticaテクニカルサポートまでお問い合わせください。 関連詳細情報 特定のクエリの性能を向上させるためには、 の  にて詳細情報が確認できます。