3D visualization of the global COVID-19 outbreak

Covid-19 has been expanding worldwide since early 2020. Its genes are continually evolving. The mutated genomes reported worldwide are being registered in an open database for epidemiological analysis and research to prevent the virus’s spread. (nextstrain.org is one of the well known opensource projects)

This project visualized a phylogenetic tree with the genome’s mutation history data. It also visualized the mutation’s spatial extent in three dimensions based on the location where each mutation is presumed to have occurred.

The blue line represents strains containing the D614G mutation in the S protein, and the red line represents strains without the one.

The D614G mutation has been known to act on a protruding protein on the virus’s surface that may increase its ability to invade and infect human cells. And as of September 2020, most of the reported variants are of the D614G type.

This visualization shows that: the D614G first appeared in Asia in January 2020 and quickly spread to Germany and Italy. It then spread across Europe to the rest of the world. Since April, the density of lines crossing the borders has decreased. This shows that governments have restricted movement.

We developed the visualization in collaboration with NHK Educational Corporation and So Nakagawa, a lecturer at Tokai University School of Medicine. NHK, the Japanese Broadcasting Company, implemented this visualization design into its big data visualization system “NMAPS.” It was broadcasted in the 4K TV program by NHK.
(Images and videos on this page are different from the 4K/8K broadcasted version.)

2020年初頭から世界で拡大を続ける新型コロナウイルス(Covid-19)。その遺伝子は常に進化している。世界各地で報告される変異したゲノムはオープンデータベースに登録され疫学的な解析や拡大の予防研究に供される。(nextstrain.orgはそうしたオープンソースプロジェクトの代表的な存在の一つである。)

このプロジェクトでは、ゲノムの変異履歴を時系列で解析した系統樹を可視化し、しかしそれだけではなく、変異が起きたと推定される位置情報をもとに空間的な広がりを3次元的に可視化した。

青いラインは、Sタンパク質のD614G型変異を含んだ系統を、赤いラインは変異を含まない系統を表している。D614G型変異はウイルス表面にある突起したタンパク質に作用し、ヒトの細胞に侵襲して感染させる能力を高める可能性があることが報告されており、2020年9月の時点で報告される変異体のほとんどをD614G型が占めている。

2020年1月に初めてアジアで報告されたD614G変異体がすぐにドイツやイタリアへ伝播しその後、ヨーロッパ全体から世界中に拡散する様子が詳細に読み取れる。また、各国政府による移動制限が図られた4月以降、国境を越えるラインが減少することから、対策とその効果を読み取ることができる。

このビジュアライズはNHKエデュケーショナル(株)、東海大学医学部講師中川草氏らと共に開発し、NHKが所有するビッグデータ可視化システム「NMAPS」の一部に組み込まれた。また、NHK BS4Kで放映された番組「ビッグデータで読み解く 新型コロナウイルス感染爆発」の中で使用された。

(※画面は開発中のもので放送内容とは異なります。)

Visualization
Design and development: Masaki Yamabe
Adviser: So Nakagawa
Client: NHK Educational Corp.

TV Program
“ビッグデータで読み解く 新型コロナウイルス感染爆発”
https://www4.nhk.or.jp/P6604/
©NHK

Data Source
GISAID