芝麻信用が信用スコア算出に使うデータについて

芝麻信用のデータ

芝麻信用は膨大な種類・量のデータをAI(人工知能)が分析し、独自の信用スコアを算出します。

もちろん公開されている情報以外にもたくさんのデータを使っているのでしょうが、この記事では芝麻信用の信用スコアの算出に使っているとされているデータをまとめます。

データの提供元となるサービス

芝麻信用にデータを提供するのは基本的には

  • (芝麻信用の親会社の)アリババグループ内のサービス

  • 芝麻信用とデータ連携しているアリババグループ外のサービス

  • 政府が公開しているデータ

この3箇所ですが、この記事ではデータの提供元ではなくデータの種類別にまとめたいと思います。

学歴や職業など登録者個人のパーソナルデータ

まず大事なのが登録者を特定するデータです。

芝麻信用は携帯(スマホ)で使うサービスで、中国では携帯電話の契約時に顔写真入りの身分証が必要です。

なので割と携帯と個人のパーソナルデータは紐づけやすいようです。

そして携帯を契約している個人の

  • 年齢

  • 学歴

  • 職業(職歴)

などのデータが芝麻信用のスコア算出に使われます。

資産に関するデータ

芝麻信用では資産に関するデータもスコア算出に使います。

例をあげると

  • 保有する企業株式

  • 車や住宅1)信用のプラットフォーム「芝麻信用」を参照しました。

などです。

株式などは価格、つまり株価の変動状況なども考慮に入れているようです。

公共料金の支払い状況のデータ

芝麻信用は公共料金の支払い状況もデータをとして使います。

具体的には

  • 電気代

  • 水道代

  • ガス代

などです。

ほかにも税金の支払い状況なども使われます。

もちろん支払いの滞納・遅延は信用スコアに悪影響を与えます。

電子決済での支払いのデータ

芝麻信用と同じアリババグループの「支付宝(アリペイ)」は中国を代表するモバイル決済サービスです。

利用者数は5億人を超えていると言われています2)会員数は日経新聞のスマホ決済で中国人集客 リクルート系、支援好調にを参考にしました。

同じアリババグループということもあり、この決済データを芝麻信用は信用スコアのスコアリングに使えます。

なので、毎秒増え続ける膨大な決済データから

  • 購買力

  • 決済の支払いに遅延していないか

などを推測・参考にしてスコア算出に使えます。

購入した商品の内容のデータ

芝麻信用は個人がどんなモノを購入したかもチェックしています。

たとえば、反社会的であるとみなされるようなものをネットで購入したら信用スコアは下がります。

逆に、人として正しい行動をしているとみなされるような商品を購入したら信用スコアが上がります。

また、いっけん人の評価とは関係なさそうなモノを買った時でも、データ的な相関関係があれば信用スコアに影響を与える可能性があります。

日本で例えると楽天やAmazonで購入した内容がすべて信用スコアの分析に使われるようなイメージでしょうか。

SNSの利用状況を示すデータ

SNSのデータも分析に使われます。

具体的にはSNSでの

  • 友達の数

  • 友達の質(友達はどんな人と友達になっているかなど)

  • SNS内での発言や行動

などで、付き合う友達の素行が悪いと自分の評価にも悪影響があるそうです。

中国では芝麻信用の流行により、芝麻信用での自分への評価を気にしてSNSでの友達も取捨選択するようになった、とも言われています。

SNSでの発言内容も信用力の分析に使われるので、公序良俗に反するような投稿は控えるようになるでしょう。

つまり芝麻信用によって現実世界とSNSが近づいたということですね。

シェアリングエコノミーの利用データ

中国はシェアリングエコノミー大国としても知られていますが、シェアリングエコノミーにおける

  • 予約した配車アプリのキャンセル

  • ofoなどの自転車シェアリングサービスで自転車を適切に返却したか

などのデータも芝麻信用では蓄積されて分析に使われます。

シェアリングエコノミーはプラットフォーム内にホストとゲストそれぞれを評価する仕組みが導入されていますが、この評価システムを生活全体に拡張したものが芝麻信用のスコアとも考えられます。

喧嘩や犯罪の履歴

政府から提供してもらえるのか、芝麻信用では個人の

  • 喧嘩などのトラブル

  • 交通違反

  • 犯罪

  • 裁判記録

などのデータもスコア算出に使われているようです。

これらの情報はアメリカ版信用スコアであるFicoスコアでも使われており、企業側としては人材採用の際に活用しているようです。

その他の行動データ

  • オンラインゲームのプレイ時間の長さ

  • オンラインゲームで不正などをせず、正しく利用しているかどうか

  • 社会問題等の対策のために寄付をしているかどうか

などのデータも信用スコアの算出に使われているようです3)https://www.newsweekjapan.jp/stories/world/2018/05/14-8_3.php

収集するデータ内容とアルゴリズムは変化する

ここまでどんなデータを信用スコアの算出に使うかを紹介しました。

紹介しましたが、芝麻信用において

  • 信用スコア算出に使うデータの種類と量

  • データを信用スコアとして数値化するアルゴリズムの内容

は常に変化します。

だからハッキング的な手法はほとんど通用しません。

さらに、嘘のデータを入力してもデータの整合性から嘘だとバレる可能性もが高いです。

楽してスコアを上げようとせず、日々の生活の内容を改善することが結果的にスコア向上につながります。

結局のところ、ここが芝麻信用というかアリババの狙いではないかと思います。

脚注・引用   [ + ]

スポンサーリンク
物置シェアの「モノオク」

シェアする

  • このエントリーをはてなブックマークに追加

フォローする