AI ボットがトラフィック画像 CAPTCHA を 100% 克服するようになりました

AI ボットがトラフィック画像 CAPTCHA を 100% 克服するようになりました


拡大する / 画像認識ボットが 100% の確率で取得できる CAPTCHA の種類の例。

しばらくウェブサーフィンをしている人なら誰でも、街路画像の CAPTCHA グリッドをクリックして、日常の物体を特定して、それが自動ボットではなく人間であることを証明することに慣れているでしょう。しかし今回、新たな研究によると、特別にトレーニングされた画像認識モデルを使用してローカルで実行されるボットは、このスタイルの CAPTCHA で人間レベルのパフォーマンスに匹敵し、明らかに人間ではないにもかかわらず、100% の成功率を達成できると主張しています。

チューリッヒ工科大学博士課程学生アンドレアス・プレスナー氏とその同僚による新しい研究、 プレプリント用紙として利用可能では、Google の ReCAPTCHA v2 に焦点を当てており、ユーザーはグリッド内のどの道路画像に自転車、横断歩道、山、階段、信号機などのアイテムが含まれているかを識別することが求められます。グーグル 何年も前にそのシステムを段階的に廃止し始めた 明示的なチャレンジを提供するのではなく、ユーザー インタラクションを分析する「目に見えない」reCAPTCHA v3 を支持します。

それにもかかわらず、古い reCAPTCHA v2 は 今でも何百万ものウェブサイトで使用されている。また、更新された reCAPTCHA v3 を使用しているサイトでも、 reCAPTCHA v2 をフォールバックとして使用する 更新されたシステムによってユーザーの「人間的」信頼度が低くなった場合。

CAPTCHA に「YOLO」と言う

reCAPTCHA v2 に勝てるボットを作成するために、研究者らは、 オープンソースの YOLO (「You Only Look Once」) オブジェクト認識モデル、長年の読者なら覚えているかもしれません ビデオゲームのチートボットにも使用されています。研究者らは、YOLOモデルは「リアルタイムで物体を検出する能力でよく知られ」、「計算能力が限られたデバイスでも使用できるため、悪意のあるユーザーによる大規模な攻撃が可能になる」と述べている。

14,000 枚のラベル付き交通画像でモデルをトレーニングした後、研究者らは、提供された CAPTCHA グリッド画像が reCAPTCHA v2 の 13 の候補カテゴリのいずれかに属する確率を特定できるシステムを構築しました。研究者らはまた、「タイプ 2」課題と呼ばれるものに対して、別の事前トレーニング済み YOLO モデルを使用しました。このモデルでは、CAPTCHA がユーザーに、単一のセグメント化された画像のどの部分に特定の種類のオブジェクトが含まれているかを識別するよう求めます (このセグメンテーション モデルは 9 つでのみ機能しました) 13 のオブジェクト カテゴリのうちの 1 つであり、他の 4 つのカテゴリが表示された場合は、単に新しい画像を要求するだけです)。

captchastudy-640x563 AI ボットがトラフィック画像 CAPTCHA を 100% 克服するようになりました
拡大する / YOLO モデルは、識別されるオブジェクトの種類に応じてさまざまなレベルの信頼性を示しました。

画像認識モデル以外にも、研究者らは reCAPTCHA のシステムをだますために他の手順も講じる必要がありました。たとえば、同じ IP アドレスからの繰り返しの試行の検出を回避するために VPN が使用され、人間の活動に近似するために特別なマウスの動きモデルが作成されました。自動エージェントをより人間らしく見せるために、実際の Web 閲覧セッションからの偽のブラウザーと Cookie 情報も使用されました。

識別されるオブジェクトの種類に応じて、YOLO モデルは、69 パーセント (オートバイの場合) から 100 パーセントの時間 (消火栓の場合) まで、個々の CAPTCHA 画像を正確に識別できました。そのパフォーマンスは、他の予防措置と組み合わせると、システムによって提示される複数の個別の課題の後でも、毎回 CAPTCHA ネットをすり抜けられるほど強力でした。実際、ボットは、同様の試験で人間よりわずかに少ない課題で平均 CAPTCHA を解決できました (ただし、人間に対する改善は統計的に有意ではありませんでした)。

戦いは続く

画像認識モデルを使用して reCAPTCHA を解決しようとするこれまでの学術研究はありましたが、成功する確率は 68 ~ 71% でした。新しい論文の執筆者らによると、成功率が100パーセントに達したことは、「われわれが今や正式にキャプチャを超えた時代に入ったことを示している」という。

しかし、これは CAPTCHA の世界においてまったく新しい問題というわけではありません。 2008 年に遡ると、研究者たちはボットをどのように訓練できるかを示していました。 オーディオ CAPTCHA を突破する 視覚障害のあるユーザーを対象としています。そして 2017 年までに、ニューラル ネットワークは テキストベースの CAPTCHA を打ち負かすために使用されています 文字化けしたフォントで表示される文字を入力するようユーザーに要求しました。

captchabreaker AI ボットがトラフィック画像 CAPTCHA を 100% 克服するようになりました

古いテキスト識別 CAPTCHA は、長い間 AI モデルによって解決可能でした。

スタック交換

ローカルで実行される AI も画像ベースの CAPTCHA を簡単に解読できるようになった今、人間の識別をめぐる戦いは、デバイスのフィンガープリンティングのより巧妙な方法へと移行し続けるでしょう。 Google Cloud の広報担当者は、「当社は、視覚的な問題を表示することなく、お客様がユーザーを保護できるよう支援することに非常に重点を置いています。そのため、2018 年に reCAPTCHA v3 をリリースしました」と述べています。 新人科学者に語った。 「現在、reCAPTCHA の保護の大部分は 7 か所にわたって行われています。 [million] 世界中のサイトが完全に見えなくなりました。私たちは reCAPTCHA を継続的に強化しています。」

それでも、人工知能システムが、以前は人間のみと考えられていたタスクを模倣する能力がますます向上するにつれて、Web ブラウザーの反対側のユーザーが実際に人間であることを確認することがますます困難になる可能性があります。

「ある意味で、優れたキャプチャは、最も知的な機械と最も知性の低い人間との正確な境界を示すものである」と論文の著者らは書いている。 「機械学習モデルが人間の能力に近づくにつれて、適切なキャプチャを見つけることがより困難になっています。」



Source link

Share this content:

Leave a Reply