自動インシデント対応プラットフォームを構築するShorelineがシリーズBで約43億円を調達

Shorelineの創業者でCEOのAnurag Gupta(アヌラグ・グプタ)氏は、同社を創業する前は8年間、AWSでインフラストラクチャに携わっていた。AWSのシステムがスローダウンしたり停止したりするインシデントに対応するシステムの責任者を務めていた。

これは大仕事で、同氏はインシデント対応を自動化する社内システムの構築に関わっていたが、マーケットプレイスには他社がそうした自動化に役立つツールが不足していることに気づいた。ソフトウェアのテストと導入、本番システムの監視、インシデントが起きた時の対応をするツールはあるが、同氏は欠けているものがあると見ていた。

同氏は、インシデントのチケットが発行され必要な人が対応を始めると、何がおかしいかをつきとめて修復するのは通常は手作業が極めて多いプロセスになると指摘する。システムがダウンすると1分ごとにコストがかさむ。ソフトウェアとシステムが複雑になり、こうした問題に対処する責任者であるSRE(サイト信頼性エンジニア、Site Reliability Engineer)が根本原因をつきとめて修復するのはさらに難しくなっている。

グプタ氏は「ほぼすべてのケースで手作業のプロセスとなり、人間は消耗してミスをします。たくさんの人手に頼る作業です。そして人間は機械よりも長い時間を要するのでダウンタイムが発生するのです」と説明する。

同社はジュピタースタイルのノートブックを作ってシステムによくある問題への対応を記録し、自動化する。問題を解決するためのステップ・バイ・ステップの手順を示し、可能な場合には対応を自動化するのだ。狙いは問題が起きた時に対応する負荷を軽減することだ。

グプタ氏は、システムの問題が発生した時にそれを解決する必要性が高まりSREの役割は急速に大きくなっているが、問題に体当たりしていくのは持続可能なアプローチではないと語る。

Shorelineに投資しているInsight PartnersのマネージングパートナーであるGeorge Mathew(ジョージ・マシュー)氏は、機械と人との協力で問題の解決を早めるのだという。

マシュー氏はShorelineに投資した理由を「ハイレベルの役割を人間が果たし、ローレベルの役割を機械学習のアルゴリズムで自動化できれば、この分野においてはたいへん魅力的なチャンスです」と説明する。

Shorelineが創業したのは2019年だが、このような自動化ソリューションを構築するのに2年半かかり、シリーズAでは2200万ドル(約27億600万円)を調達した。このプロダクトを発売してからすでに約半年が経ち、従業員はすでに50人近くいる。

グプタ氏は創業に関し、自社が事業をしている世界を反映した従業員を有することが自分にとって重要なゴールであると語る。

同氏は「当社の従業員はテックの世界ではなく社会全般と同じようでなくてはならないと強く確信しています。テックの世界には組織的なバイアスがすでにあるからです」と語る。つまり、従業員の比率を実際の人口比に一致させようとしている。

「私が変わることなく信じているのは、雇用のプロセスに多様性を取り入れれば、結果として企業は多様になるということです」と同氏はいう。

米国時間3月28日、ShorelineはInsight Partnersが主導し、Dawn Capitalが参加した3500万ドル(約43億500万円)のシリーズBを発表した。Shorelineによれば、今回のラウンドでこれまでの調達金額の合計は5700万ドル(約70億1100万円)となった。

画像クレジット:Dansin / Getty Images

原文へ

(文:Ron Miller、翻訳:Kaori Koyama)

Ubisoft「サイバーインシデント」後に従業員のパスワードをリセットした理由を明言せず

ゲーム業界大手のUbisoft(ユービーアイソフト)は、会社のパスワードが大量にリセットされたセキュリティインシデントを確認したが、実際の事件の内容については明言を避けた。

Ubisoftは簡単な声明の中でこう述べている。「先週、Ubisoftは当社のゲーム、システム、サービスの一部に一時的な混乱を引き起こすサイバーセキュリティインシデントを経験しました。当社のITチームは、外部の一流専門家と協力して、この問題を調査しています。予防措置として、全社的にパスワードのリセットを開始しました」。

「また、当社のすべてのゲームとサービスは正常に機能しており、現時点では、この事件の副産物としてプレイヤーの個人情報にアクセスまたは暴露された証拠はないことをお知らせします」と声明は述べている。

フランスに本社を置く同ゲーム会社は「Assassin’s Creed (アサシン クリード)」や「Far Cry(ファークライ)」シリーズで知られている。10月に発表された同社の最新の業績報告書によると、Ubisoftのアクティブプレイヤー数は1億1700万人とされる。

ユーザーのパスワードや従業員の認証情報が漏洩した恐れがある場合、企業がパスワードのリセットを開始するのは珍しいことではない。

TechCrunchは、Ubisoftにいくつかの質問を送った。その中で、ネットワークへの侵入かどうかなど、サイバーセキュリティインシデントの性質について説明するよう求め、不正なデータアクセスや流出の証拠を検出するためのログなどの手段を有しているかどうかを尋ねている。ログがあれば、データが流出したかどうかを、ログがなく証拠もない場合よりも高い確度で知ることができる。

Ubisoftの広報担当者は、このインシデントに関して「これ以上共有する情報は何もない」と述べている。

画像クレジット:Frederic J. Brown / Getty Images

[原文へ]

(文:Zack Whittaker、翻訳:Den Nakano)

NVIDIAがサイバーセキュリティのインシデントを調査中、2日間デベロッパーツールとeメールがダウン

米国の半導体メーカーNVIDIAが、同社のデベロッパーツールとeメールシステムをダウンさせた可能性のあるサイバーインシデントを目下調査中であると認めた。

NVIDIAは声明で、このインシデントの性質と影響範囲を目下調査中だと述べているが、結果的に同社の営業活動には影響が及んでいないと付言している。

つまり「現在、インシデントを調査中である。弊社の事業と営業活動は中断されずに継続している。この事象の性質と範囲を未だ調査中であり、現時点では他に付け加えるべき情報はない」ということだ。

NVIDIAはインシデントの詳細を共有しないが、The Telegraphは「ネットワークへの悪質な侵入」により、これまでの2日間にわたって同社のeメールシステムとデベロッパーツールが停止の被害を被った」と報じている。

その記事は内部者の情報として、同社のシステムが2日間オフラインになったが、eメールシステムの当該部分は米国時間2月25日に稼働を再開したという。

ハッカーがNVIDIAやその顧客に関するデータを入手したかどうか、また、そのパートナーのいずれかが影響を受けたかどうかは、まだ明らかになっていない。The Telegraphの報道によると、NVIDIAはまだ犯人を特定できておらず、顧客はいかなる事件も知らされていなかったという。

NVIDIAのサイバー攻撃の可能性に関するニュースは、サンタクララに本拠を置く同社が、英国のチップ設計企業Armを買収するための400億ドル(約4兆6223億円)の入札を打ち切ったわずか数週間後に飛び込んできたものだ。同社は「当事者による誠実な努力にもかかわらず、取引の完了を妨げる重大な規制上の課題」の結果、相互の決定であったと述べている。

関連記事:NVIDIAがArmの買収を断念、Armはリーダーが交代し株式公開を模索

画像クレジット:Justin Sullivan/Getty Images

原文へ

(文:Carly Page、翻訳:Hiroshi Iwatani)

英国外務省が「深刻なインシデント」のために緊急サイバーセキュリティ支援を要請

英国の外務省が「深刻なインシデント」の対象となり、緊急のサイバーセキュリティ支援を要請せざるを得ない事態となっていたことがわかった。

このインシデントは、最近発表された公開入札書類で確認されたものだ。現地時間2月4日に公開されたこの書類では、外務・英連邦・開発省(FCDO)が、サイバーセキュリティの契約先であるBAE Applied Intelligence(BAEアプライド・インテリジェンス)社に「緊急の業務支援」を要請したことが明らかになっている。

この通知によると、FCDOは、2022年1月12日に締結された「当局のサイバーセキュリティインシデントを分析するためのビジネスアナリストおよびテクニカルアーキテクトの支援」を行う契約を発行した後、同社の援助に対し46万7325.60ポンド(約7300万円)を支払っている。

しかし、これまで公表されていなかったこの事件の詳細は、依然として不明のままだ。

「当局は深刻なサイバーセキュリティインシデントの対象となったが、その詳細は公表できない」と、この書類には書かれている。「このインシデントを受けて、修復と調査をサポートするために緊急の支援が必要となった。この業務の緊急性と重要性のため、当局は一般手続きや制限手続き、あるいは競争的交渉手続きの期限を遵守することができなかった」。

BAEとの契約については、The Stack(ザ・スタック)によって初めて報じられた。

名前を明かさなかったFCDOの広報担当者は、TechCrunchに対し、同局はセキュリティについてはコメントしないが「潜在的なサイバーインシデントを検知し、防御するためのシステムを持っている」と語った。この広報担当者は、機密情報へのアクセスがあったかどうかなど、この事件に関する詳しい質問には答えなかった。

TechCrunchは英国のデータ保護当局にも連絡を取り、この事件が報告されたかどうかを確認したが、まだ回答は得られていない。

なお、今回明らかになった事件が報じられる数日前には、国際的な文化交流と教育機会の促進を専門とする英国の公的機関であるBritish Council(ブリティッシュ・カウンシル)でも、重大なセキュリティ上の過失が発覚している。Clario(クラリオ)のセキュリティ研究者が、保護されていないMicrosoft Azure(マイクロソフト・アジュール)のストレージ・サーバー上に14万4000の暗号化されていないファイルを発見したが、その中にはブリティッシュ・カウンシルの学生の個人情報やログイン情報が含まれていたのだ。

2020年12月には、サセックス州にあるFCDOの執行機関であるWilton Park(ウィルトン・パーク)がサイバー攻撃を受けており、英国の国立サイバーセキュリティセンターによる調査の結果、データが盗まれた証拠はないものの、ハッカーが6年間にわたって同機関のシステムにアクセスしていたことが判明している。

画像クレジット:Chris J. Ratcliffe / Getty Images

原文へ

(文:Carly Page、翻訳:Hirokazu Kusakabe)

Discordがダウンしていたのはあなただけではなかった

グループチャットプラットフォームDiscordで、太平洋時間1月26日正午(日本時間1月27日5時)前からAPIの問題が広範囲に発生している。つまり、あなたがゲーマー / 暗号資産のプロ / Discord好きのどれかであるのなら、自身のポッドキャストのサーバー、#petsチャンネルに飼っている犬の写真をアップロードできなくなっている。スタートアップの中にはDiscordをSlackのように使っているところもあるため、短時間のシステム停止でも影響があったり、a16zが資金提供しているスタートアップの社員全員にお休みをもたらすかもしれない。

「API停止の根本的な問題を特定しましたが、データベースクラスタの1つで二次的な問題に対処しています。我々は、オンコール対応チーム全体がオンラインで、この問題に対応していま」と同プラットフォームは投稿している。本稿執筆時はサイトがダウンしてから約45分後であり、Discordはデータベースが再び健全な状態になり、ユーザーが徐々に再接続できるようになっていると述べていが、それでもすぐにログインできない可能性があり、エラーメッセージが表示される可能性が高いだろう。

Discord

最初の障害から1時間余り、Discordはサーバーステータスのページで、半分以上のユーザーがオンラインに戻ったことを掲示していた。

画像クレジット:Discord/Eric Szwanek

原文へ

(文:Amanda Silberling、翻訳:Katsuyuki Yasui)

英国労働党、党員データ流出の原因は第三者業者を狙ったサイバー攻撃と発表

英国の労働党は、第三者企業へのサイバー攻撃により、党員のデータが漏洩したことを確認した。

労働党は、全党員に送られ、同党のウェブサイトにも掲載されたEメールの中で、10月29日に名前の明かされていない第三者データ処理業者から「サイバーインシデント」の報告を受けたと述べている。

詳細はまだ不明だが、労働党によると、このインシデントにより「かなりの量の党データがシステム上でアクセス不能になった」という。インシデントに対応した人物がSky Newsに語ったところによると、この事件は労働党のサードパーティサプライヤーに対するランサムウェア攻撃だったとのこと。労働党はまだこれを確認しておらず、TechCrunchはさらなる情報を求めている。

また、侵害の規模も不明で、どのようなデータが流出したかもまだわかっていない。有料メンバーの財務情報を保有している労働党は、影響を受けたデータについて「党員、登録・提携している支援者、その他党に情報を提供した個人を含む」としている。

しかし、元党員や非党員にも多くの影響があったようだ。あるTwitter(ツイッター)ユーザーは、2009年に党を脱退したにもかかわらず、データ漏洩の通知を受け取ったと主張しており、他のユーザーは、党員になったことがないにもかかわらず、メールを受け取ったと述べている。また、労働党員ではないが、労働党系組合の組合員として政治献金を支払ったことでデータ流出の影響を受けたという人もいる。

労働党には約43万人の党員がいる。同党の声明によると、調査は進行中だ。国家犯罪対策庁(NCA)、国家サイバーセキュリティセンターにも報告し、情報コミッショナーオフィス(ICO)にも報告したという。

NCAのスポークスパーソンは次のように述べている。「NCAは、労働党に影響を与えたサイバーインシデントの犯罪捜査を主導しています。我々は、潜在的なリスクを軽減し、この事件の性質を評価するために、パートナーと緊密に協力しています」。最近、英国の各政党にデータ保護の実践を改善するよう促したICOも、今回の事件について積極的に調査を行っていることを確認している。

労働党は、今回の事件の全容、状況、影響を「緊急に調査」するために、攻撃を受けたサードパーティサプライヤーとも緊密に協力していると述べている。なお、今回の攻撃では、党自体のデータシステムには影響がなかったことを強調している。

労働党がランサムウェアの被害に遭ったのは、今回の事件が初めてではない。労働党は2020年、クラウドソフトウェア企業のBlackbaud(ブラックボード)が保管していたデータがランサムウェア攻撃を受けたとして、党員に警告を発した。当時、同党は、数年にわたる寄付者の情報が流出したと考えられると述べていた。

画像クレジット:Oli Scarff / Getty Images

原文へ

(文:Carly Page、翻訳:Aya Nakazato)

社内のインシデント対応における人間的側面を示すレポート機能「ヒートマップ」をKintabaが公開

Kintaba(キンタバ)は、Facebookサイトの信頼性向上に貢献してきた2人が立ち上げたスタートアップで、インシデント対応をライフサイクル全体で監視するプロダクトを開発している。米国時間11月4日、同社は「ヒートマップ」と呼ばれる新しい機能を発表した。これは、人間的な側面からレスポンスを見て、インシデントが発生したときに組織内の人々がどのように対応するかを理解するための方法だ。

Kintabaの共同創業者でありCEOのJohn Egan(ジョン・イーガン)氏は、同社の創業者たちはFacebook(フェイスブック)で経験を積んだ後、データを通じてインシデント対応にポジティブな焦点をもたらす、あらゆる組織規模に対応したプロダクトを作りたいと考えていたと語っている。従来のインシデント対応ツールでは把握することが難しかった、インシデントに最も関与した人物を把握することができるのだ。

「これは、管理一式全体のレポートをより高いレベルで見ることができます。つまり、その場で何が起こったかを見るのではなく、時間を追って振り返ることができるのです」とイーガン氏は説明する。

画像クレジット:Kintaba

ヒートマップを見ることで、インシデントがいつ発生したのか、さらにはそのインシデントによって影響を受けているのは誰なのか、といった傾向を把握することができると同氏は考えている。「これは、これまで欠けていた、もう一段階高いレベルのインシデント情報です」と語った。

このデータが前向きに活用され、時間をかけてプロセスを改善したり、インシデントの報告や対応に尽力している人々に報いることで、会社や顧客への影響を軽減できるようになることを願っている。同氏は、これはインシデント対応の自然な進化であり、人間的、文化的側面に目を向けたものだと考えている。

「文化的な課題は、実際には人々の課題であり、会社全体レベル(インシデント対応の)で導入をする際には、こうしたデータが必要になります。そして、これこそがこの分野の進む方向性であり、(従来の評価基準よりも)はるかに興味深いものだと思います。この分野では、企業がインシデントレスポンス管理をより健全な方法で実践できるように進化し続けていると思います」と述べている。

Kintabaは2020年設立され、これまでに225万ドル(約2億5500万円)を調達している。

画像クレジット:PM Images / Getty Images

原文へ

(文:Ron Miller、翻訳:Akihito Mizukoshi)

インシデント発生時にチームのコミュニケーションをより円滑にするIncident.io

Incident.ioは、Index VenturesとPoint Nineが主導して470万ドル(約5億2000万円)の資金を調達したと発表した。Incident.ioは、企業が障害やデータ侵害に直面した際に、問題について社内外に発信し、可能な限り迅速に解決するための適切なフレームワークを提供するスタートアップだ。

Index VenturesとPoint Nineに加えて、オンライン銀行Monzo(モンゾ)の創業者であるTom Blomfield(トム・ブロムフィールド)氏とJonas Templestein(ジョナス・テンプレスタイン)氏、Passion CapitalのEileen Burbidge(アイリーン・バービッジ)氏、Eventbriteの共同創業者であるRenaud Visage(ルノー・ヴィサージュ)氏など、複数のビジネスエンジェルが出資している他、GoCardlessのHiroki Takeuchi氏やLoomのVinay Hiremath(ヴィネイ・ヒレマス)氏など、一部の顧客も出資している。

Incident.ioは、Slackとの深い連携から始まる。多くのチームは、複数のツールを使い分けている。1つのサービスで障害を追跡しながら、それについてチームの他のメンバーとSlackで話し合う。これは非効率的であり、情報のばらつきにつながる。

Incident.ioでは、すべてがSlackで起こる。インシデントはSlackのチャンネルで発表され、何かが起こったときに人々は通知を受けることができる。「/incident」ショートカットを通して、一貫したフォーマットでインシデントを作成することができる。

その後、Incident.ioは自動的に特定の問題に関する別のチャンネルを現在の日付で作成する。ここでも、Slackのチャットボックスからサービスを利用したり、ボタンをクリックしたりすることができる。例えば、問題を誰かに割り当てたり、サマリーを追加したり、問題をエスカレートしたりできる。

そしてこれはSlackのチャンネルなので、人々はそのチャンネルで問題を議論できる。これにより、すべての情報を同じ場所で見られる。進行中のインシデントに人を追加すると、彼らにIncident.ioからサマリーが送られてくるので、不要な質問をする必要がない。

その情報はSlackだけに留まらない。クライアントは、インシデントの一覧が表示された独自のIncident.ioダッシュボードにアクセスできる。それぞれのインシデントには、参加者やイベントのタイムラインを含む独自のページが用意されている。例えば、GitHubのプルリクエストは自動的にこれらのタイムラインに追加される。

企業はこれらの情報を活用して事後報告の記事を作成し、チームや顧客と共有することができる。基本的に、Incident.ioを使用している企業は、より抜かりなく問題を処理し、その問題についてより透明性を高めている可能性が高い。これは、チームメンバーと顧客の両方にとって、より良い体験につながるはずだ。

画像クレジット:Incident.io

原文へ

(文:Romain Dillet、翻訳:Aya Nakazato)

システム障害に対応するエンジニアのための共同作業ノートブック「Fiberplane」

アムステルダムを拠点とするFiberplane(ファイバープレーン)は、Googleドキュメントのグループ編集に似た方法で、SRE(サイト・リライアビリティ・エンジニア)がインシデントに取り組むための共同作業ノートブックを構築している。このアーリーステージのスタートアップ企業は現地時間9月16日、シードラウンドにおける750万ユーロ(約9億7000万円)の資金調達を発表した。

この投資ラウンドは、Crane Venture Partners(クレーン・ベンチャー・パートナーズ)とNotion Capital(ノーション・キャピタル)が共同で主導し、Northzone(ノースゾーン)、System.One(システムワン)、Basecase Capital(ベースケース・キャピタル)が参加した。

通称Mies(ミース)と呼ばれているMicha Hernandez van Leuffen(ミシャ・ヘルナンデス・ファン・ロイフェン)氏は、Fiberplaneの創業者でCEOだ。以前起ち上げたスタートアップのWerker(ワーカー)が2017年にOracle(オラクル)に買収されたことをきっかけに、ヘルナンデス・ファン・ロイフェン氏はより大きな会社の一員となり、そこで(どこの会社でも起こる)障害への対応に苦労している人々を目にした。

関連記事:WerckerをOracleが買収、コンテナベースのデベロッパープラットホームに既存大手も着目

「私たちは常にメトリクス、ログ、トレースの間を行ったり来たりして、私はいつもこれを宝探しと呼んでいるのですが、機能停止やダウンタイムの根本的な原因を突き止めていました」と、ヘルナンデス・ファン・ロイフェン氏は筆者に語ってくれた。

同氏はこの経験から、インシデント対応に関するいくつかの重要な洞察が得られたという。1つ目は、すべてのインシデントデータを集めておく集中的な場所が必要だということ。2つ目は、分散したシステムを管理する分散したチームが、しばしば異なるタイムゾーンを越えて、リアルタイムに協力する必要があるということだ。

2020年8月にOracleを退職した同氏は、DevOps(デブオプス)チームやSREに、組織内の他のチームがGoogleドキュメントやNotion(ノーション)などのツールで行っているのと同じようなグループ編集機能を与えることができないかと考え始め、新会社のアイデアを具体化させていった。

同氏がFiberplaneで作り上げたものは、SREがさまざまな種類のデータを取り込み、インシデントを解決するために共同作業を始めるためのコラボレーションノートブックだ。同時にこのノートブックには、何が起き、どのように問題を解決したかという自然な監査証跡を残すことができる。Googleドキュメントを複数の人が編集できるように、このノートブックにもさまざまな人が参加できるようにすることで、当初の構想を実現している。

複数の人が関わっているFiberplaneのコラボレーションノートの例(画像クレジット:Fiberplane)

しかし、彼はそこで止まるつもりはない。長期的なビジョンとしては、SREやDevOpsチームが障害のあらゆる側面に対応できる運用プラットフォームを目指している。「これは私たちの出発点です。しかし、ここからさらに拡大して、いわばSREのワークベンチとして、インフラを指揮・管理できるものにしたいと考えています」と、同氏は述べている。

現在、Fiberplaneでは13名の従業員が働いており、今も成長を続けている。彼らは、今の彼らがそうであるように、多様性のある会社を作るための方法を模索しており、より多様な候補者を見つけるための具体的な戦略を検討している。

「私たちは多様な人材を雇用するために、当社のトップ・オブ・ザ・ファネルのプロセスを再検討しているところです。当社の取り組みとしては、社会的弱者のコミュニティに求人情報を掲載したり、求人情報の記述をジェンダーデコーダにかけたり、求人情報の公開期間を長くしたりしています」と、Fiberplaneのマーケティングマネージャーを務めるElena Boroda(エレナ・ボロダ)氏は述べている。

ヘルナンデス・ファン・ロイフェン氏はアムステルダムを拠点としているが、同社は英国、ベルリン、コペンハーゲン、そして米国でも人材を雇用しているという。従業員の大半がアムステルダムに住んでいるため、オフィスが再開される際にはアムステルダムを中心拠点とする計画だ。

画像クレジット:lemono / Getty Images

原文へ

(文:Ron Miller、翻訳:Hirokazu Kusakabe)

システム障害に対応するエンジニアのための共同作業ノートブック「Fiberplane」

アムステルダムを拠点とするFiberplane(ファイバープレーン)は、Googleドキュメントのグループ編集に似た方法で、SRE(サイト・リライアビリティ・エンジニア)がインシデントに取り組むための共同作業ノートブックを構築している。このアーリーステージのスタートアップ企業は現地時間9月16日、シードラウンドにおける750万ユーロ(約9億7000万円)の資金調達を発表した。

この投資ラウンドは、Crane Venture Partners(クレーン・ベンチャー・パートナーズ)とNotion Capital(ノーション・キャピタル)が共同で主導し、Northzone(ノースゾーン)、System.One(システムワン)、Basecase Capital(ベースケース・キャピタル)が参加した。

通称Mies(ミース)と呼ばれているMicha Hernandez van Leuffen(ミシャ・ヘルナンデス・ファン・ロイフェン)氏は、Fiberplaneの創業者でCEOだ。以前起ち上げたスタートアップのWerker(ワーカー)が2017年にOracle(オラクル)に買収されたことをきっかけに、ヘルナンデス・ファン・ロイフェン氏はより大きな会社の一員となり、そこで(どこの会社でも起こる)障害への対応に苦労している人々を目にした。

関連記事:WerckerをOracleが買収、コンテナベースのデベロッパープラットホームに既存大手も着目

「私たちは常にメトリクス、ログ、トレースの間を行ったり来たりして、私はいつもこれを宝探しと呼んでいるのですが、機能停止やダウンタイムの根本的な原因を突き止めていました」と、ヘルナンデス・ファン・ロイフェン氏は筆者に語ってくれた。

同氏はこの経験から、インシデント対応に関するいくつかの重要な洞察が得られたという。1つ目は、すべてのインシデントデータを集めておく集中的な場所が必要だということ。2つ目は、分散したシステムを管理する分散したチームが、しばしば異なるタイムゾーンを越えて、リアルタイムに協力する必要があるということだ。

2020年8月にOracleを退職した同氏は、DevOps(デブオプス)チームやSREに、組織内の他のチームがGoogleドキュメントやNotion(ノーション)などのツールで行っているのと同じようなグループ編集機能を与えることができないかと考え始め、新会社のアイデアを具体化させていった。

同氏がFiberplaneで作り上げたものは、SREがさまざまな種類のデータを取り込み、インシデントを解決するために共同作業を始めるためのコラボレーションノートブックだ。同時にこのノートブックには、何が起き、どのように問題を解決したかという自然な監査証跡を残すことができる。Googleドキュメントを複数の人が編集できるように、このノートブックにもさまざまな人が参加できるようにすることで、当初の構想を実現している。

複数の人が関わっているFiberplaneのコラボレーションノートの例(画像クレジット:Fiberplane)

しかし、彼はそこで止まるつもりはない。長期的なビジョンとしては、SREやDevOpsチームが障害のあらゆる側面に対応できる運用プラットフォームを目指している。「これは私たちの出発点です。しかし、ここからさらに拡大して、いわばSREのワークベンチとして、インフラを指揮・管理できるものにしたいと考えています」と、同氏は述べている。

現在、Fiberplaneでは13名の従業員が働いており、今も成長を続けている。彼らは、今の彼らがそうであるように、多様性のある会社を作るための方法を模索しており、より多様な候補者を見つけるための具体的な戦略を検討している。

「私たちは多様な人材を雇用するために、当社のトップ・オブ・ザ・ファネルのプロセスを再検討しているところです。当社の取り組みとしては、社会的弱者のコミュニティに求人情報を掲載したり、求人情報の記述をジェンダーデコーダにかけたり、求人情報の公開期間を長くしたりしています」と、Fiberplaneのマーケティングマネージャーを務めるElena Boroda(エレナ・ボロダ)氏は述べている。

ヘルナンデス・ファン・ロイフェン氏はアムステルダムを拠点としているが、同社は英国、ベルリン、コペンハーゲン、そして米国でも人材を雇用しているという。従業員の大半がアムステルダムに住んでいるため、オフィスが再開される際にはアムステルダムを中心拠点とする計画だ。

画像クレジット:lemono / Getty Images

原文へ

(文:Ron Miller、翻訳:Hirokazu Kusakabe)

Slack内にSREのインシデント管理ソリューションを構築する「Rootly」

企業がその複雑なマイクロサービス方式のソフトウェアスタックの、インシデントに対応しようとすると、サイトリライアビリティエンジニア(SREs)が登場して問題を処理し、すべてがうまくいき、アプリケーションが立派に動くようにする。そして、新登場した初期段階のスタートアップRootlyは、Slackの中にインシデント対応ソリューションを作ってその処理を助ける。

米国時間7月8日、同社はステルスを脱して320万ドル(約3億5000万円)のシード投資を受け取った。そのラウンドはXYZ Venture Capitalがリードし、8VCとY Combinator、そして数名のテクノロジー企業の役員たちが個人で参加した。

Rootlyの共同創業者でCEOのQuentin Rousseau(クエンティン・ルソー)氏によると、同氏はSREを、Instacartで初めて経験した。彼が入った2015年は、同社の1日のオーダーが数百程度で、彼が去る2018年には数千になっていた。しかしそれだけスケールしてもアプリがダウンしないようにすることが、彼の仕事だった。

Instacartにいたときに、多くの人が問題に対応する際、一定のパターンがあることに気づいた。辞めてからの彼はサイドプロジェクトとして、インシデント応答処理をSlackの中でコントロールすることに取り組んだ。彼が見つけた共同創業者のJJ Tang(JJタン)氏は、ルソー氏が2018年に辞めた後のInstacartで仕事を始めていた。そして2人はSREsがインシデントへの対応をめぐって直面するユニークな問題の解決を助ける、Rootlyの創業を決心した。

「要するに私たちは、多くの人がSlackの中で直接、インシデントを管理、解決できるようにしたかったのです。その上に複雑な別のレイヤーを置きたくはなかった。既存のさまざまなツールはそれでなくても多いのですが、混乱状態になって問題が炎上したらできるだけ早く解決にフォーカスしたいものです。そこで、Slack体験にフォーカスするのが良いだろうと考えました」とルソー氏は説明する。

SREsたちはRootlyのソリューションを使って、Slackの中でいろいろなツールにすばやくコネクトする。それはJiraかもしれないし、ZendeskやDataDog、あるいはPagerDutyかもしれない。そして、インシデントの解決をめぐってSlackの中で交わされている会話に基づいて、バックグラウンドでインシデントレポートを編纂する。チームがインシデントの解決後にミーティングをするとき、それが役に立つ。

同社はまだ小さくて、10人足らずだが、シード資金を得たため2022年は技術者も営業も増やしたいと考えている。

タン氏によると、同社の企業文化の中心にあるのがダイバーシティであり、XYZ Venture CapitalのマネージングディレクターであるRoss Fubini(ロス・フビニ)氏のような投資家と仕事ができるのも、そのおかげだという。アジア系米国人であるタン氏は「ロス氏をリード投資家として選んだのも、そのためです。彼の企業はファンドとしてダイバーシティに力を入れているだけでなく、ポートフォリオ企業への影響も考えています」という。

フビニ氏によると、多様性に富む企業を作るためには、雇用のレベルでそれを目指すだけでなく、雇用後、マイノリティーの人たちが自分が歓迎されていると感じられるような環境を作ることが重要だという。「Rootlyとの初期の会話からわかったのは、多様な人材から成るグループを作るだけでなく、企業は多様な人材がいることを有利に生かせるという観点も必要だということです。だから、彼らにとって魅力的な企業であるだけでなく、彼らが、ここが自分の場所だと感じられるような企業環境を作っていかなければなりません」とフビニ氏は語る。

同社は現在、完全にリモートで、ルソー氏はサンフランシスコ、タン氏はトロントだ。計画ではオフィスを完全に再開できるまではリモートで行う。なおルソー氏とタン氏は今、Y Combinatorの育成事業に参加している。

カテゴリー:ソフトウェア
タグ:RootlySlackインシデントサイトリライアビリティエンジニアリング資金調達

画像クレジット:Alina Naumova/Getty Images

原文へ

(文:Ron Miller、翻訳:Hiroshi Iwatani)

インシデントを一元的に分析できるプラットフォームを提供するJeli.ioが4.2億円を調達

2020年11月末にAWSの東海岸にあるデータセンターの1つがダウンした際にはRoku、Adobe、Shiptなど、同社のサービスに依存している無数の企業が影響を受けた。インシデントが解決すると、同社は何が起こったのかを分析(AWSリリース)しなければならなかった。ほとんどの企業にとってそれは、インシデントが発生した1つの集中型プラットフォームではなく、社内の様々なツールから情報を手作業でまとめることをともなう。

Jeli.ioは、インシデント分析のための一元的な場所を提供することで、この状況を変えたいと考えている。同社は米国時間12月7日、Harrison MetalとHeavybitが参加するBoldstart Ventures(ボールドスタート・ベンチャーズ)主導のシードラウンドで、400万ドル(約4億1620万円)の資金を調達したと発表した。

JeliのCEOであり創設者でもあるNora Jones(ノラ・ジョーンズ)氏は、インシデント分析についてよく知っている。彼女はNetflix(ネットフリックス)でカオスエンジニアリングのツールの構築に携わり、後にSlack(スラック)でカオスエンジニアリングの責任者を務めた。カオスエンジニアリングは、システムをストレステストすることで、起こりうるインシデントをシミュレートするのに役立つが、それでももちろんインシデントは起こる。彼女はそこから学ぶべきことがたくさんあることを知っていたが、インシデントに関するすべてのデータを自動的にまとめる方法はなかった。彼女はそれを実現するためにJeliを開発した。

「Netflixがダウンしたとき、Slackがダウンしたとき、あるいは他の組織がダウンしたときなど、インシデントが発生時にそれを見ることは、組織がどう機能しようと考えているかということと、実際にどのように機能するかということの差を理解するきっかけになるという秘密を発見しました」と、ジョーンズ氏は私に語った。

彼女は、意思決定プロセス、関わっている人間とツール、そして企業が非常にストレスの多い状況でどのように対応したか、どのように解決したか、そして将来同じような障害が再び起こらないようにするために何ができるかを理解することに、大きな価値があると気づいた。役に立つ製品がなかったため、ジョーンズ氏は前職で自らツールを作り始めたが、より幅広いソリューションが必要だと考えていた。

「私たちはJeliを立ち上げ、インシデントの後にどこに注目すべきかを知るためのインサイトを提供することで、エンジニアを支援するツールの構築を始めました」と彼女はいう。Jeliでは、インシデントに関する情報が記録されたメール、Slackチャンネル、PagerDuty、Zoomの記録、ログなどからすべてのデータを引き上げることで、これらの情報をすべて手作業でまとめなくても、何が起こったのかを理解するのに役立つインサイトを明らかにさせる。

このスタートアップは現在8人の従業員を擁しているが、2021年には全面的に人員を追加する計画だ。その際、彼女は多様な労働力を構築することの重要性を認識している。「私はダイバーシティとインクルージョンに対して非常に力を入れています。これは私にとって初日から重要なことであり、必要なことでもあります。私は以前、組織の中で自分だけが代表者になったことがあり、その気持ちはよくわかっています。多様な人材がすべて仕事に参画し、それぞれの能力や経験、考え方が活かされること。初日からそのことを確認したいと思っています。それが最終的にはより良い製品につながるからです」と、ジョーンズ氏はいう。

Jeliの製品は現在プライベートベータ版で、同社は初期の顧客と協力してプラットフォームを改良している。今後数カ月間は企業の募集を続け、2021年のある時期にはより広く公開する予定だ。

Boldstart VenturesのジェネラルパートナーであるEliot Durbin(エリオット・ダービン)氏によれば、彼がジョーンズ氏と話を始めたのは彼女がNetflixにいた数年前のことで、当時はこの分野について学んだだけだったという。そして彼女に会社を始める準備ができたとき、ダービン氏の会社は、このスタートアップが収益前の状態であっても、早期の小切手を書くチャンスに飛びついたと語っている。

「ノラに会ったとき、彼女は物事をより回復力のあるものにすることを生涯の使命としていることに気づきました。そして、私たちは彼女が起業する何年も前から彼女のことを知っていたお陰で、すでに話し合っていたことを自然に継続することができました」とダービン氏は説明している。

関連記事
AWS障害にともない他社サービスもダウン
カオスエンジニアリングの対象をKubernetesクラスターに拡張したGremlin

カテゴリー:ネットサービス
タグ:Jeli.ioインシデント資金調達

画像クレジット:PCH-Vector / Getty Images

原文へ

(翻訳:TechCrunch Japan)