工業用メモリー余聞 ラボからの報告

<h1>工業用メモリー余聞</h1>

11

産業用CFカードと民生用CFカード、その違いは決してフラッシュチップだけではありません。

主な違いは5つあります。

1. ファームウェアアルゴリズムの違い。
産業用CFファームウェアアルゴリズムは、欠陥管理、エラーチェック、訂正などの最もインテリジェントなプログラミングを備えています。

2. ドライブのディスクタイプ
 市販の民生用CFカードは、リムーバブルディスクとしてよく使用されます。 産業用CFカードは、通常、組み込みアプリケーションに使用される固定ディスクです。

3. 予期しない停電に対応する能力
 停電に対しては産業用CFカードは、ソフトウェアによって保護されるだけでなく、予想外の破壊的な電力変動に物理的に抵抗するように設計されています。 民生用CFは通常、ソフトウェアによってのみ保護されます。

4. 温度条件の変動
 産業用CFカードは-40℃~85℃で使用できますが、市販の民生用CFカードは動作温度範囲が-25℃~85℃です。

5. フラッシュメモリーの種類
 SLC(シングルレベルセル)フラッシュを使用する産業用CFカードと、MLC(マルチレベルセル)フラッシュを使用する市販の民生用CFカードで異なります。
自動車 インフォテインメント自動車や飛行機で旅行するときは、映画、音楽、地図、交通情報などの情報やエンターテイメントを利用して、楽しい快適な旅をしたいと考えます。 IVI(車載用インフォテイメント)システムは、列車、飛行機、マイカーで移動中の運転手や乗客に対してその役割を担います。 インフォテイメントシステムとは、具体的には車のダッシュボード上のタッチスクリーンデバイスや旅客機の席にあるエンターテイメントシステムのことです。 これらのIVIシステムは、システム自体にビデオ、ミュージックマップ、ナビゲーション、およびオペレーティングソフトウェアなどすべてのデータを格納する堅牢で信頼性の高いハードウェアを備えている必要があります。 そのため、今日の先進的な次世代インフォテインメントシステムでは、最も堅牢で信頼性が高く、効率的なNANDフラッシュベースの産業用SLCフラッシュストレージが使用されています。

SLCフラッシュストレージは、インフォテインメントアプリケーションの場合、50K〜100Kの耐久P/Eサイクル、衝撃と振動に対する高い信頼性、より幅広い動作温度範囲、8GB〜256GBの容量範囲を特長としており、最も適切なソリューションとなります。 このSLCフラッシュを採用した丈夫なSSD ソリッドステートドライブは、GPS、サーモスタットコントロール、バックアップカメラディスプレイ、オーディオ/ビデオ再生オペレーティングシステムなどの重要なデータを保存し、車、列車、航空機など過酷な環境条件に耐えます。

Forbesによると、フラッシュストレージ市場全体の推定5%は、最新のインフォテインメントシステムで使用している自動車業界からのものです。今日の自動車では、ドライバーアシスト機能、3Dマッピング、データイベントレコーダー、スケジュール効率の向上、車両とローカルネットワーク間のより高速な通信など、ますます多くのデジタル機能が使用されるため、今後数年間で10%以上になると予測されています。

市場で入手可能な他のストレージデバイス(SRAM、DRAM、EEPROM、NOR、およびMLC NANDなど)の中で、SLC NANDフラッシュストレージソリューションは、各セルが1ビットのデータ(1または0のいずれか)を含む革新的なフラッシュストレージアーキテクチャを採用しています。これらのSSDドライブは、最大トレース幅が32nm〜43nmです。トレース幅が広いと、消費電力が少なくなり、性能が向上し、耐久性が向上します。これらは、インフォテイメントアプリケーションを含む業種の運用上の価値を提供する上位3つの要因です。

例えば、43nm SLC NANDの耐久性は、100,000サイクル/物理ブロックとすることができる。さらに、SLCフラッシュのエラーレートは、pSLC、MLC、およびTLC NANDなどの他のバリエーションよりも大幅に低くなっています。事実、産業グレードのSLCフラッシュカードは、他の形態のNANDフラッシュ記憶装置と比較して、物理ブロック当たり300%多くの耐久サイクルを提供することができる。

産業用フラッシュストレージは、自動車産業の温度要求に耐えるように設計されています。 SLCフラッシュベースのストレージソリューションは、-40〜85℃の極端な温度範囲で完全に動作します。さらに、2000Hzまでの外部振動に対して大きな抵抗力があります。これらのFlashストレージソリューションは、カスタムデータロード、コンフォーマルコーティング、OEMラベリング、その他の規制要件など、特定のアプリケーションベースの要求を満たすようにカスタマイズすることができます。シングルレベルセルNANDユニットのこれらの優れた特性は、タッチスクリーンの応答性の向上、荒い路面や凹凸路面での運転からの干渉の低減、乗客により速いインフォテイメントを提供する能力など、データ集約型のインフォテインメントや接続されたカーアプリケーションに理想的ですエンターテインメント)の経験を提供します。

工業用SLCフラッシュストレージの主な特長:

-40〜85℃の温度範囲で完全に機能
耐振動 2000Hz
耐久サイクル 100K
最大トレース幅 43nm
AEC-Q100仕様準拠
データの破損、セルのクロストーク、フリップビット、またはその他の外乱の影響を受けない
極限環境でのライフサイクルの延長、優れた性能、機能の向上、最適な耐久性
カスタマイズオプション
強化された電源破壊耐性
ストレージ容量 最大256GB

「当社製品でのデータ損失の代償はとても大きい。 カード寿命の終わりを予測する方法はありますか?」



デジタルサイネージ

使用モデルにどれだけうまく最適化されていても、組み込まれたストレージは、ある時点で寿命に達します。 どのようなフラッシュストレージのテクノロジーを持ってきたとしても、限界があります。 デルキンはライフサイクルマネジメントの一環としてさまざまな手法を用いてフラッシュメモリー製品を最大限に活用するために取り組んできました。 「すべてのサプライヤからのすべてのストレージソリューションはある時点で消耗して使用不可になる」という事実に対処するということは、すなわちストレージの製品寿命の終わりを予測するということです。 データが失われる前、またはその他のコストが発生する前に、障害を予測してストレージを交換できることは、多くの機器製造メーカーにとって重要な要素です。


Industrial Gradeリムーバブルストレージで使用されるSMARTコマンドは、障害の予測、停止時間の短縮、予防保守のスケジューリングの効率を大幅に改善しました。 SMARTコマンドは、SD、CF、SSD、CFASTカードなど、さまざまなフォームファクタで採用されています。これらのSMARTコマンドを製品の初期状態の評価のために使用するだけでなく、組み込みホストのアプリケーションに実際に「SMARTトリガー」をインストールすることで、予想外のデータ損失を未然に解決する予測・予防対応が実現しました。



カスタマーストーリー



デジタルサイネージ(電子看板)では、組み込まれているストレージのデータの損失が、見ている人誰もがすぐにわかってしまうアプリケーションです。 デジタルサイネージとは屋外・店頭・公共空間・交通機関など、あらゆる場所で、ディスプレイなどの電子的な表示機器を使って情報を発信するシステムです。 メモリーカードの寿命が終わってしまった場合は、ブランク画面やエラーメッセージが表示され、結果として何らかの損害を招いたり安全上の問題を引き起こす可能性があります。 そのため、デジタルサイネージのビジネスは、ディスプレイの表示不良にかかわるリスクを回避することばかりに固執することなく、予防的なメンテナンスを積極的に行うことを重要視しています。



「私たちが必要としているフラッシュカードが見つかりません。たとえ新しいものでも予期せずデータが失われてしまいます。 そこで工業用グレードのフラッシュメモリーは当社のハードウェアよりも長持ちすると考えました。 私たちの考えは、現場に設置するコンパクトフラッシュカードを産業用に替えれば、より堅牢で、予期せぬ故障も少なくて済むというものでした。」と、大手デジタルサイネージ機器製造会社のプロダクトマネージャーは説明しています。 「カードは消耗しますが、予期せぬデータ損失は非常に高いものにつきます。カード寿命の終わりを予測する方法はありますか?」



デルキンの調査



CPU技術はフラッシュメモリーの開発同様、長年にわたって改良されており、5年前のデザインのコントローラでは、最新のCPUが持つツールや機能が使用できないのです。
その一つであるSMARTツールの登場により、すべての組込みカードユーザーへよりも多くのデータとカードの健康情報がもたらされました。 また、この情報は入手しやすく、ホストアプリケーションでも実行できます。



Delkin Customer Applicationsチームの最初のステップは、顧客の要件を完全に理解することでした。 カードの使用モデルから出発して、Delkinはカードが時間とともにどのように使用されたかを理解することができました。このデータから、カード耐久性と耐用年数を見積もることも容易になりました。 顧客は予期せぬ故障によって悪影響を受けたていたので、科学的な根拠を持たないものの有効寿命がまだ15%残っているフラッシュカードの交換を承諾しました。これは、通常の保守点検よりも少し費用の掛かる予防保守点検に対して取り組む下地となりました。

SMARTは、ブロックごとのP/Eサイクル、不良ブロック数、残りのスペアブロック、カードの通常の起動回数、さらには異常な電源投入回数などの重要なカード情報を取得します。これにより、他の多くの情報とともに、機器自体の状態、またカードの寿命を予測することが可能になりました。



デルキンソリューション



このデータを使用して、顧客はSMARTコマンドを使用してフラッシュ耐久性を判定し、カード残存寿命を決められたしきい値と比較することで数値化し、カードのSMART評価を定期的に実行するアプリケーションをプログラムすることができました。 このアプリケーションは5つの重要なカード使用状況の抽出データを選択し、それらを決められた最大値と比較することによって、カードが85%の使用状態に達するとホストに通知することができます。 通常、これには数年かかりますが、これが予期しないデータ損失を事実上防止するツールとなりました。さらに、カードが破損したり、カードの取り付けに異常があった場合、それをを警告する手段となりました。 これは、サービス担当者に、他の問題、例えば、他の場所で発生していた熱や電力の異常などを認識させる可能性があります。 最終的には予期せぬエラーの撲滅とはるかに信頼性の高いデジタルサイネージシステムを実現することが出来ました。

SMARTは、PC上の診断ツールとして、Delkin Devices SMART Dashboard 1.1ソフトウェアのようなものを使用して、推定されたカードの耐久性を確認するためにも使用できます。営業担当者に問い合わせしてください。



「現場でダッシュボードカメラの故障が発生、CFカードが原因でカメラ起動時に問題が発生していると思われる」

砂漠フォームファクタとしてのコンパクトフラッシュは、20年以上にわたり多くの組込み製品OEMによって使用されている安定した産業用記憶媒体です。この規格では、インターフェイスにHDDを模倣するように設計されたシンプルな50ピンコネクタが使用されています。デザインの頑丈さとシンプルさは、頑丈なストレージにとって最も人気のある選択肢の1つになっています。

1994年に初めて導入されたとき、CompactFlashはSLC(Single Level Cell)フラッシュを使用し、全世界的に普及した最初のカードフォーマットの1つでした。 まだいくつかのデジタル一眼レフカメラやビデオカメラで使用されているCompactFlashは、文字通り世界中の何千ものホストに常駐しています。 4つの物理チップを搭載し、頑丈なコンテナにメモリを収納することで、高速で大容量で、汚れや温度の高い環境でも使用できます。 SLCを使用するCFの唯一の欠点の1つは、高価になる可能性があるということでした。

MLC(マルチレベルセル)フラッシュが導入されたとき、CFカードは未来が開かれたように見えました。 実際に安価なフラッシュで、C​​Fのすべての利点を楽しむことができました。  MLC CFカードはコンシューマ製品の標準となりました。温度範囲の縮小と新しいMLCフラッシュに特有のプログラム/消去サイクルの減少にもかかわらず、産業用組込み機器の顧客でも技術の検討が始まりました。

カスタマーストーリー

「ダッシュボード・セキュリティ・カメラを最初に顧客に販売した時からコストダウンの方法を模索していました。 当社の製品を必要としているこの市場セグメントは、コストと予算の両方に敏感であることがわかっており、手ごろな価格と高い信頼性を武器に、顧客の全車両での採用を狙っていました。 我々は、MLC導入時にCFカードの温度仕様に問題があるかどうかの検討を行いましたが、私たちの出した結論は、車両内の温度が人間が快適であると思う範囲を超えない環境であり、エアコンを使えば 0〜70℃を超えることはないということでした。 」

「不具合の現象からCFカードの設計か動作上の問題であることが明らかだったため、起動時にどのカードがどの状態にあるのかを調査し、その原因を特定に努めましたができませんでした。 当社のサプライヤがCFカードで問題を見つけられなかったとき、エンジニアの一人がデルキンに連絡を取りました。」

デルキン調査

カメラメーカー担当者はデルキンの販売員に電話し、問題を説明しました。 セールス担当者は上司と話し合い、将来この顧客と仕事をする機会があるかもしれないことを考慮し、デルキンの技術チームが問題解析に参加することを決めました。 彼らが何らかのテストや代替的な診断のアイデアを提案できれば、カメラメーカーがこの苦境から抜け出して、更なるビジネスの発展に繋がるかもしれません。

デルキン カスタマー アプリケーションチームは、よく問題のある他のブランドのカードを使用しているユーザーから電話を受けます。 通常、会話は限定されたものになります。私たちの設計や製造をしていないカードの問題を診断するのは難しいからです。 しかし、根本的な原因を突き止めるために、少なくともいくつかのアイデアを与えたり、テストの必要性をアドバイスすることはできます。

ホスト、オペレーティングシステム、工業用SBC(Single Board Computer)の使用状況、環境、および故障したユニットの詳細についての簡単な打ち合わせの際に、故障したユニットがすべて極度の熱環境にあったことが判りました。 ユマ アリゾナ州、パームスプリングス カリフォルニア州、フェニックス アリゾナ州です。 このカメラが全国的に販売されているにもかかわらず、あまり暑くない地域や寒い環境では障害は発生しませんでした。 温度に関する理論が再検討されることになりました。

デルキンMLC CFカードは、Powayにある施設の温度チャンバで試験しました。 当社のHALTおよびHASS機器では、カードがホストで使用されている間の動作マージンを決定するために急激な温度変化が使用されました。フラッシュは0~70°Cで評価されていましたが、定格より5~7°高い温度で起動して動作することができました。 この程度のスペックに対してのマージンは、大手ブランドのフラッシュを使用する場合は普通のことで、場合によっては仕様を10%超超える場合もあります。 80℃を超えるとカードはもはや動作しなくなることが判りました。

デルキンソリューション

HALTとHASSテスト(高加速寿命試験と高加速ストレス画面)は、内蔵モードの故障モードと根本原因、機能上の動作限界、機能破壊限界を判断するのに最適です。この「破壊試験」により、メーカーは製品の動作マージンを決定することができ、使われている関連部品の「リンク」の中で最初に壊れるものの特定もできる可能性もあります。 例えば、コネクタ、CPU、フラッシュチップ、または何らかの基礎をなす構成要素が故障する最初のパーツになるかもしれません。 この情報はデルキンのような製造業者が設計の動作マージンを増やすために可能な限り「弱いリンク」を置き換えることによって耐久性を最大にするのに役立ちます。

Dashboardカメラの問題は、動作温度ではなく、ストレージ温度でした。ストレージ温度は、通常、動作温度よりも高く、回路に通電されていません。 故障が発生した時、カメラは炎天下の下で車に乗せられており、窓は数時間締め切られた状態でした。 そのカメラケースの内部の温度は100°C(212°F)を超えていて、乗員がエアコンをオンにしても、温度が車内の調整温度まで低下するまでにかなりの時間がかかるでしょう。 100℃の始動温度はMLCフラッシュの仕様を超えており、動作できませんでした。この問題のソリューションはより良い換気ボックス、またはSLCフラッシュへの切り替えとなりました。 もう1つの解決策は、ダッシュボードカメラの電源を入れる前に、ある程度の冷却時間を置くことでした。

サンフランシスコに拠点を置くPumpkin Inc.は2000年以来人工衛星用各種コンポーネント、ユニット製品を製造・販売するユニークな会社です。 Pumpkin Inc.は、彼らの製品を支える重要なパーツであるSDカードにDelkin Devices製 工業用SDカードを選択し、以来ずっとPumpkin社はDelkin Devices 工業用SDカードを、宇宙船の中で常に使用し続けています。

Delkin SDは衛星で使われているPumpkin社は、市販の「ナノサテライト」を開発・製造する最初の会社でした。 
「ナノサット」とは最大10キロの小型衛星のことです。 2002年以来、Pumpkin社は数多くのCOTSサテライトを販売してきました。 衛星キットの多くはエンドユーザがカスタマイズするためのものです。 
Pumpkin社は今、打ち上げ準備の整ったターンキー衛星として顧客の仕様に合わせて作られた完全な宇宙船の開発にフォーカスしています。

各衛星に搭載されているフライトコンピュータにはSDスロットがあり、そのスロットで使用が許可されているSDカードは唯一、Delkin社拡張温度範囲の工業用SDカードのみです。 
現在の仕様では、フライトコンピュータには複数のスロットが設けられており、少なくとも2つのDelkin 工業用SDカードが付属しています。

初期の立方体型衛星は低消費電力のマイクロコントローラを使用し、2GBの記憶容量に制限されていました。 
Pumpkin社のCEO / CTO、Andrew Kalman博士によると、「宇宙空間は厳しい環境なので、冗長システムは標準的なものと考えます。 最新の設計には、プライマリとバックアップの2つのSDスロットが含まれています。 私たちはSDカードを適切に保持するための対策を取りますが、カードを取り扱う上で他の特別なことを行う必要はありません。 開発中にSDカードを使用することには多くの利点があります。」

顧客は、教育、科学、娯楽、芸術、国防など様々な分野に及び、それぞれの目的でPimpkin衛星を使用しています。

Pumpkin社の顧客への第1四半期の2017年出荷には、前述もターンキー型宇宙船が含まれます。

■ 「Overview1」は、軌道からビデオをキャプチャするためにSpaceVR用に設計され構築されたバーチャルリアリティ宇宙船です。

■ 「バッカニア」はオーストラリアのニューサウスウェールズ大学向けに教育目的と実験目的のために作られました。

■ 「SUPERNOVA」は、米国海軍のRapid Innovation Fundプログラムで設計された多目的ビークルです。このフライトユニットは、空軍工科大学によってフライト認定を受けました。 テストでは、連続して読み書きをしながら、真空下でのホットサイクルとコールドサイクルを含む空間の影響をシミュレートします。 SUPERNOVAにはNSA認定のハードウェア暗号化通信が含まれており、サイバーセキュリティ専門家が当社の電子機器を見直していることが確認されています。
「私たちは、民生用SSDが「産業用デバイス」として使うには適していないことを認識していませんでした。」

民生用の製品は、宣伝広告による影響もあり、最初に意識してしまうのがブランドであったりするものです。 これはこれでよいのですが、組み込み用の工業用ストレージ・デバイスを検討する際に、この考えは大きな誤りとなるのです。

民生用ソリューションは、高いキャパシティとスピードのような優先順位に重点を置いています。多くの場合、コストやドル/ GBで測定されます。一方、工業用組み込み機器ソリューションでは、データの完全性、環境堅牢性(ショック、温度、振動)と電気的堅牢性に重点を置いています。 
ここを間違えると大変なことが起こることになります。

カスタマーストーリー

「当社は、当社製品への組み込み用SSDをNANDフラッシュ製造で有名なA社製とすることを決定しました。 当社の製品は、データがオフライン時にドライブに書き込まれること、データ量も少ないことから、速度について心配はしていませんでした。 この製品の優位点としては、大変ポピュラーな一般ユーザ用製品として多くの小売店でも入手がしやすく、また価格も安く購入できることでした。 私たちは、それらのアプリケーションが私たちの機器の使用用途よりはるかに集中的に酷使されていると想像していました。 」

私たちは最初に、ドライブがランダムに読み込み専用に切り替わってしまう問題を認識しました。  私たちは、トリガーイベント、またはこれを引き起こした可能性のあるエラーを見つけるために調査を行いました。 ドライブはオフラインになり、それ以降のデータの書き込みは許可されませんでしたが、その時点までに書き込まれたすべてのデータは、ドライブで読み取ることができました。 私たちの技術者は、システム内のドライブを再初期化することで、修復されたように見えました。 最も古いドライブの故障の割合が急に上昇しはじめたように見えたときにも、この現象の発生原因を調査中でした。 この段階では約1ヶ月でドライブの2〜4%をが読み取り専用となる状況でしたが、これが10%を超え、15%まで上昇しました。 私たちは心配をしはじめました。

デルキンの調査

既製品のSSDのクライアントアプリケーションには、容量、速度、コストという3つの要素があります。 これらの機能は、速度重視のラップトップやサーバーでうまくいきます。 しかし、これらの機能は、ユーザーがコンピューター環境にあることを前提にしており、実査にはデータがかなり特殊な方法で書き込まれています。  問題は、多くの工業用組み込みシステムでは、実際にはほとんどが、フラッシュにデータを書き込むというコンピュータと同じスタイルを採らないことです。

産業用組み込み型SSDソリューションでは、注目すべき機能が全く異なります。 データの完全性が最優先され、環境と電気の堅牢性、ライフサイクル管理、フラッシュの利用、アプリケーションの仕様によって決まるその他の多くの機能の順に高い優先順位を占めています。

多くの組込み機器のホストにはLinuxが採用されており、ホストソフトウェアのカスタマイズを容易にします。 このため、NANDフラッシュに関連する1つ以上の制約が試されてしまうことがよくあります。 フラッシュは、プログラムおよび消去サイクル(P/Eサイクル)に基づいて摩耗していきます。 書き込まれるファイルのサイズは、P/Eサイクルに大きな影響を与えます。すべてのフラッシュは、その構成に基づいて利用可能な限られた数のP/Eサイクルを有しています。

典型的なFLASHチップは、4Kまたは8Kまたはそれ以上のバイトの「ページ」が、フラッシュチップに応じて256ページから16Kページのいずれかのブロックにグループ化されるように構築されています。 したがって、1つのブロックに大量のデータを格納することができます。 デバイス上の1つの制約は、消去可能な最小単位がブロック全体であることです。 したがって、1ページ内の数バイトが更新される場合、データは更新された新しいブロックに移動されなければならず、前のブロックは消去され、将来の書き込みに使用されます。 デバイスの第2の制約は、データの保持が危険にさらされる前にブロックを消去できる回数が制限されていることです。

新しいデータが物理チップに書き込まれると、そのデータは空きページに書き込まれます。 ユーザーが非常に少量のデータ、たとえば256バイトを書き込む場合、ページ全体を使用してその256バイトのデータを保持します。残りのページは未使用です。これは、一度ページを開くと、追加のデータで「書き直す」ことができないためです。次の256バイトの書き込みでは、この新しいブロックの256バイトのデータを保持するために別の空きページが使用されます。これらのデータが連続する場合、ファームウェアは前の256バイトを新しい256バイトとともに新しいページに移動し、それらをまとめて保持します。 このように、あるページから別のページへのデータの書き換えは、同じデータがFLASHに書き込まれる頻度を測定する「書き込み増幅」(WA)を引き起こします。

デルキンソリューション

これらの要素を考慮すれば、ドライブの動作モードや作業負荷がドライブの寿命に大きく影響することがわかります。 この場合のドライブの寿命に影響を及ぼす最大の要因は、コンシューマーグレードのTLCフラッシュが書き込みに使われ、且つアプリケーションの書き込みのサイズが小さかったことです。 ある種類のフラッシュメモリーではP/Eサイクルが非常に少なく、ドライブが最大P/Eサイクルに達すると、不良ブロックを交換するためにスペアブロックを使い始めることになります。 スペアブロックの数は限られていますので、これらを使い切ると、多くのドライブが読み取り専用になってしまいます。 これが今回、お客様のドライブに起こったことでした。 一部のドライブでTLCフラッシュを使用すると、わずか800 P/Eサイクルに制限されることがあります。 有名ブランド数社の市販されているフラッシュの利用可能な消去回数は、TLC:800、MLC:3000、SLC:60000 です。 しかし、これらの生の数値は、誤差補正やウェアレベリングなどのツールを使用して大幅に増加させることができます。

学んだ教訓

この件は小容量のSLCドライブに切り替えることで問題が解決しました。 おそらく、ホストアプリケーションを変更してファイルサイズの書き込みを調整するなどの他の解決策もありますが、ドライブのワークフローへのこの調整は時間がかかり、コストがかかります。 製品を選択する際には、ストレージソリューションとホストのワークフローを一致させることが重要です。 クライアント市場向けに設計された小売りのSSDやその他のストレージ製品の有名ブランドは、最適なソリューションではない場合があります。 より小さい容量のSLCベースのSSDを使用することで、顧客はもともと使用していた大容量のSSDと比較して、無理のないコストを達成することができました。

ハンドヘルド機器の某メーカーは、驚くべき速さで彼らの主力製品を返品の山にしている元凶のSDカードの破損に苦しんでいました。 被害を受けた顧客は、現場のデータ破損を報告しており、すべての注文をキャンセルすると脅していました。 この問題に対処するチームは、既存のメモリカードサプライヤからのサポートを得ることができませんでした。

カスタマーストーリー

「マーケティング担当者が主力のハンドヘルド機器のバッテリー寿命を延ばすことができるかどうかを技術部門に尋ねてきたのは6ヶ月前です。 この機器は、当社のベストセラーで最も収益性の高いコア製品であり、製品ライン全体を牽引する主力製品でした。 電力の改善が市場シェアを最大3%増加させ、2016年を最も収益性の高い年にすることができると推定されました。

調査の結果、SDカードの電源を切ることで、全体的な電力使用量を減らし、充電間のバッテリ寿命を延ばすことができることがわかりました。 変更がアプリケーションに加えられ、テストされ、わずかですが節電が達成されました。 私たちは感動しました! この変更はすべてのユニットで実装され、改良された出力レーティングで起動することができました。

この改良品の出荷後すぐに、私たちは最大かつ最長の顧客の1人から電話を受け取り、数えきれないほどの問題の報告を受けました。 この顧客は、すべての注文を取り消し、彼らが持っていた製品を返品すだけでなく、代わりのサプライヤを探し始めることにしました。

デルキンでの調査

この機器メーカーは、Delkinの顧客アプリケーションチームを迎え入れ、両社で問題の根本的な原因究明が始まりました。 すぐに使用モデルを理解し、ホストとカードの間のバスアクティビティをキャプチャするように作業進めていきました。 カードは一見、破損しているように見えましたが、現象の発生頻度はランダムであり、理由を理解する必要がありました。

調査を進めていく過程で、私たちは、SDカードのデータ破損が、追加された省電力ソフトウェアの変更の結果であることを知りました。 カードの電源がオフになっている間、顧客はカードが信号ピンの漏れから継続動作に十分な電力を引き出していることに気付きませんでした。 小さな電力漏れは、CPUを有効にしてハウスキーピング機能を実行するのに十分ではありましたが、どのタイプの書き込み操作を試みても、すぐに電源が落ち、フラッシュ書き込みエラーが発生していました。これによりデータは破壊されていました。

デルキンソリューション

デルキンは、SDカードの電源を単に「切る」のではなく、電源を切る前に、顧客がそれぞれの信号ピンを低電圧で駆動するようにアプリケーションを修正することを推奨しました。 この修正はデータ破損の問題を解決するだけでなく、主装置の電源を切った後に電流漏れを防止することにより、さらに多くの電力を節約する可能性がありました。

顧客はアプリケーションソフトウェアをすばやく更新することができました。 新しいコードをロードしてテストした後、数日ですべてのユニットが更新され、顧客ベースに出荷されました。信頼が回復し、安定した収入源が救われました。

学んだ教訓

NANDフラッシュメモリカードは単なる「メモリチップ」よりもはるかに複雑であることを覚えておくことが重要です。 劣化した電力が問題となるこのシナリオでは、フラッシュ書き込みが誤って解釈され、データがフラッシュ内の間違った場所に送られました。

「当社の製品は200ドル以下で販売されており、高価なSDカードを採用することは許されませんでした。」

あなたがモペッド(エンジン付き自転車)にジェット燃料を入れないように、安価な製品には通常高価なSLCベースのカードを付属したりはしません。 誰も199ドルものSDカードを必要とする60ドルの機器にお金を払う人はいません。 これは工業製品の現実であり、時には正しいカードの価格ポイントが高すぎるため、OEMの場合、経済性を優先するため安価なカードの採用が必要となる場合があります。しかし、だからといってそれが問題を覚悟した上での選択という意味でもありません。

カスタマーストーリー

SDカードが消耗により、どの製品でも年間約1回の障害が発生する傾向にありました。 この問題は、データを収集のために設計された数百から数千もの安価なデバイスを顧客が導入したとしても管理可能と思えました。彼らがデバイスの98%からデータをプロットすることができれば、通常は必要なものを得るのに十分でした。私たちのデバイスは、24時間7日間連続でカードに絶えずデータを記録していたので、SDカードを使い切る傾向がありました。 安価なMLCベースのSDカードを使用すると、カードのTBW規格を超えることが多く、最終的には読み込み専用になります。

私たちはホストが過酷な環境で動作していることを認識していました。したがって、TBの書面による制限を超えることに加えて、私たちはしばしば、私たちのデバイスがテキサスでは極端に熱い環境の中で、ベネズエラのような場所のサイトで巨大な温度変動がある中で使われていることがわかりました。 これらの温度変化および極端な変化は、SDカードの消耗を加速し、カードをより早く破損させることがあります。 私たちは約10ドルの予算を持っていたので、エラーが起きれば新しいカードに置き換えました。

デルキンの調査

「私たちはデルキンのフラッシュメモリーの耐久性に関する論文を見たことでデルキンと知り合うことが出来た」と話し始めた。それを機会にSDカードのエラーとカードの識別法、交換するためのプロセスについての検討を開始しました。

デルキンの顧客アプリケーションエンジニアリングチームが関与し、環境に関する一連の質問だけでなく、使用されているOS、アプリケーションソフトウェア、そして最終的にカードがどのようなワークロードを経験しているかについても尋ねました。 カードは消耗していました - プログラム/消去サイクル数(P/Eサイクル)がフラッシュの定格を超え、スペアブロックが消耗して カードは無効化されていました。この障害モードは、使用モデルに適しており、この使用環境でMLCベースの製品ではそれ以上のことはできませんでした。 今回、Delkinの役割がサプライヤーよりもコンサルタントということもあり、状況を改善するためにできることすべてを実行していることを再確認することができました。

デルキンソリューション

議論された1つのポイントは、カードの寿命末期の故障が予測できる場合、状況は顧客にとってより管理しやすいことであった。

提供された解決策は、Delkin SMART Dashboardとライブラリを含むSMARTコマンドのDelkinのサポートを使用することでした。このユーティリティは、ユーザが選択した間隔で重要なカード情報を抽出することを可能にします。 このデータには、カードの残存寿命の推定%、消去回数、残りのスペアブロック情報が含まれます。 このツールを使用すると、フィールドに展開する前に、または定期的に予定されているメンテナンススケジュールに合わせて、製造元または顧客が情報を入手することができます。 約10%未満のライフサイクルが残っているSDカードは、フィールドでエラーが起きる前に置き換えられます。

このソリューションは、顧客にとって完璧であることが判明しました。 装置の構成要素が検査された定期的な保守間隔があり、このステップをプロセスに追加することによって、顧客は現場の故障をほぼゼロに減らすことができました。

しかし、デルキンのスマートツールはデルキンカードでしか使えなかったので、顧客は仕様変更をする必要がありました。

学んだ教訓

問題を解決するには複数の方法があり、問題を緩和する方法を探している顧客とDelkinとのチームとして働くことが重要です。ホストの使用モデル、およびホスト環境が正しい解決策を得るためには、長い道のりを歩むことができます。いくつかのソリューションはコストに重点を置くことができ、あるレベルの欠陥が許容される可能性があり、他の設計にはゼロの障害要件があり、既知の問題を回避するためにカスタム設計またはより特長のコントローラが必要です。最も重要なのは、責任を回避する理由を見つけるよりも、問題の解決に重点を置いたサプライヤーを選ぶことです。
「DelkinのSDカードは、新しい大容量デュプリケータでは動作しません。他ブランド製品では問題ありません。」

背景:

何年もの間、Delkin SDカードを購入していた顧客は、売上高が大きく伸び、新しいコンテンツローディング機器(Duplicator)を購入しました。 デュプリケーターでカードにコンテンツを追加した製品は、3年以上も問題なくホスト機器で使用されていました。販売が好調だったこともあり、また新しいデュプリケータがラインに持ち込まれました。

カスタマーストーリー:

新しい36スロット、高速のデュプリケーターが購入、設置されましたが、すぐに障害が発生しました。 私たちは古いデュプリケーターでデルキンのSDカードを動作させていましたが、問題なく書き込むことができました。 しかし、新しい機器に挿入すると、非常に高い故障率が発生してしまいました。 次に試したことは、他のブランドのSDカードと、新しい機器との組み合わせでしたが、問題はありませんでした。 私たちは出荷を続ける必要があったため、最初のステップでは、古い機器のデルキンカードを複製し、新しいデュプリケーターでは別のブランドのカードを使用して作業を進めました。 理想的な状況ではありませんでしたが、機器の特性やデルキンSDカードに何か問題があったかどうかを判断する時間はありませんでした。

Delkin Discovery:

最初に、顧客はデュプリケーターの製造元に連絡をしました。 製造元はいくつかのテストを実行し、コピー検証フェーズではなく、リード検証テスト中にDelkinカードが故障していると判断しました。 デュプリケーターのメーカーは、デルキンのSDカードがシステムと互換性がないとの報告を出してきました。

顧客がデルキンに連絡し、その問題を調査するためのケースが開かれました。 最初に、顧客が経験した結果が、顧客が使用していたのと同じ環境で再現されました。 次に、読み取り確認の段階でカードに障害が発生したことが確認され、デュプリケータのベンダーレポートが正しいと判明しました。 さまざまなテストが実施され、問題なくデルキンカードが複製されていた顧客が使用した以前のデュプリケーターも分析されました。

Delkinソリューション:

Delkin SDカードの信号については、組み込みシステムの使用に適したタイミング仕様を満たしており、また、カードの消費電力やその他の仕様もすべて規格内収まっていました。 分析中、カードのBUS強度が電力を節約するためにわずかに減少したことに気づきました。 Delkin SDカードの初期化で利用できる多くのオプションの中には、このように電力を節約するオプションがあります。初期デュプリケータ上のケーブルは、新しい高速デュプリケータ上のケーブルの長さの半分であったことも注目されました。その後、これが問題の原因であることが判明しました。カードとデュプリケータマザーボードとの間の配線距離が、読み取り中にカード信号が弱くなっていることがわかりました。デュプリケータ製造元はケーブルの長さを変更できなかったため、デルキンはカードのバス強度を上げてカードをカスタマイズし、重複している間の読み取り確認エラーを防いだ。

教訓:

このシナリオでは、カードの電源が最適化され、エラーが発生しました。ホスト製造業者(この場合は複写機メーカー)が問題を解決するための変更を行うことができなかったため、デルキンはカードを修正することができました。このカスタマーストーリーのもう一つの教訓は、ホストやソフトウェアではなくカードのカスタマイズが、他の可能なソリューションより速く、安価で簡単になることがあることです。デルキンのケースでは、新しいパーツ番号が発行され、カスタム初期化命令が追加されました。これにより、追加されたバス強度のカードのみが保証され、問題は解決されました。
「同じメーカーからの同じカードを2年間使用していますが、突然仕様変更?」

背景:

新しい顧客が私たちに電話をして当社のCFカードについて尋ねてきました。 彼らは何年もの間、Amazonで同じブランドと容量の民生用グレードのCFカードを購入しており、 過去に問題が一度も起きたことがないという話をしてくれました。 彼らは、ブランド名、モデル名、そして容量が同じならば、性能、特性がまったく同じカードになると思い込んでいました。しかしながら、最新のロットでは全く異なる機能と仕様を示し、自社のホストでは動作しませんでした。 まったく突然に、製品の構成要素上、重要度の低い、最小限のものと考えられていた部品が、製品全体の出荷を妨げるということが起こりました。

カスタマーストーリー:

同じブランドのカードを使用した場合、最初にテストしたものと同じカードを購入することが常に考えられました。 CF(CompactFlash)カードを初めて購入したとき、Amazonで、4つまたは5つの異なるブランドのカードを購入しました。いくつかはうまくいき、他は問題を抱えていました。 私たちはよく知られたトップブランドの採用を決定しました。 私たちはこのブランドカードの評価に一生懸命取り組みましたが、製品の内部部品の変更が行われるかもしれないという事実について考えたことはありませんでした。 しかし、私たちの仮定は間違っていました。 過去2年間に同じブランドと容量カードを購入してきましたが、今回、15回目の注文で来た製品は、動作しませんでした。 最初に、ホストソフトウェアまたはハードウェアでOSのアップグレードや変更が行われていないことを確認し、すぐに変更されたカードであることを確認しました。 私たちは、カードがサプライヤーでどのように作られたのか、技術的に知識のある人間と接触するのに苦労しました。 最終的には、BOM(部品表)を頻繁に変更することでコストを節約することが出来ているというを聞いただけでなく、コンシューマの使用を目的とした製品であるため、変更の内容、影響が把握されていないようでした。 私たちはすぐに代替ソースを探し始めました。

デルキンの調査:

当初、デルキンのカスタマーアプリケーションエンジニアリングチームが関与し、お客様にカードの使用モデルがどのようなものであるか、およびレビューできる最低限の環境または性能仕様があるかどうかを尋ねました。 これが利用できないときは、ホストを借りて、顧客アプリケーション環境を最適に複製する方法についての情報を求めました。わずか数日間のテストの後、アプリケーション要件と顧客のコストとリードタイムに関する商業的な期待に最も合致するカードがデルキンによって推奨されました。 サンプルカードが顧客に送られ、テストされました。 これらのカードは合格し、量販注文はカリフォルニアのPowayにある私たちの工場から出荷されました。

デルキンソリューション:

デルキンカードの大きな違いは、顧客が承認し注文した部品番号に基づいてBOMを管理していたことです。この部品番号には、フラッシュ部品番号、コントローラ、およびファームウェアを含むが、これに限定されないカードの多くの側面が定義されています。 BOMをこの部品番号でロックすることにより、顧客は何らかの理由でカードを改変しないことが保証されました。さらに、EOLのフラッシュや推奨されるファームウェア変更のために、変更が必要な場合は、そのパーツ番号の変更、推奨交換部品、および前回承認された部品の最終出荷を購入し、スケジュールを設定します。この通知は、顧客が提供された交換部品をテストするのに十分な時間を許すように行われました。デルキンの部品番号は、コンテンツのロード、または任意の顧客が必要とするカスタム機能またはファームウェアを指定するためにカスタマイズすることもできます。

教訓:

民生品のエレクトロニクスの世界では、NANDフラッシュカードやドライブの採用品を決定した後でも、それらの部品を変更することで「コストダウン」を実現するという方法が取られます。 この考え方は、ほとんどの工業製品メーカーの考え方とは相容れません。 カードやドライブを承認するには、数週間、さらには数カ月かかることがあります。 さらに、EPA、FAA、FDCなどの様々な機関からの承認が必要となる場合があります。 多くの場合、経済的にも市場投入までにも大きな費用がかかります。ホスト内のコンポーネントを変更すると、このテストと承認が危険にさらされる可能性があります。 制御されたBOMを持つことは、産業および組込み市場にストレージ製品を供給するためのパズルの重要な部分の1つにすぎません。
3D NANDフラッシュとは、メモリセルを複数層、垂直に積み重ねることを可能にする、フラッシュストレージにおける高度なアーキテクチャです。 高密度大容量化を目指すフラッシュストレージにとって洗練されたデザインであり、最適なソリューションとなります。 複数のレイヤーを構築することにより、より大きなジオメトリが使用可能になり、より高い信頼性と高密度を実現することができます。 製造されたビットの約50%が2017年中頃までに3Dになると推定されています。

3D NANDの強みの1つは、1GBあたりのコストが低く、高密度の大容量ストレージを必要とするクライアントSSDおよびコンシューマ向け製品には理想的なデバイスです。 3D TLC NANDは、Planar / 2D MLCと比較して消費電力を抑えながら、書き込み/書き込みが高速になります。 更に、3D TLC NANDはPlanar/2D MLCに比べてダイの面積当たりの記憶容量は倍以上にもなります。

3D NANDフラッシュが適さない産業用アプリケーションとしては、32GBを下回るような比較的低容量ストレージを必要とするものなどいくつか考えられます。 高耐久性と長寿命サイクルを必要とするアプリケーションは、引き続き2Dフラッシュデバイスを最大限に活用していくことになります。重要なのは、シングルレベルセル(SLC)テクノロジは2D planer NANDのみで利用可能なテクノロジーであるということです。

フラッシュストレージ技術の進化と3D NANDフラッシュの機能、そしてフラッシュアーキテクチャを利用した業界の方向性に注目することはエキサイティングです。この技術は、3D NANDの性能、耐久性および全体的な成熟度の更なる改善がなされるにつれて、より幅広い産業用途にも適用可能なデバイスになるはずです。