데이터 저널리즘의 작업 : 작성, 분석, 청소, 찾기 … 반복

 

번역 : http://www.hanb.co.kr/network/view.html?bi_id=1777
원문 : http://radar.oreilly.com/2011/09/data-journalism-process-guardian.html

The work of data journalism: Find, clean, analyze, create … repeat
데이터 저널리즘의 작업 : 작성, 분석, 청소, 찾기 … 반복

Simon Rogers on the effort behind data journalism.
Simon Rogers는 데이터 저널리즘의 후면에서 지대한 노력을 쏟고 있습니다.

Data journalism has rounded an important corner: The discussion is no longer if it should be done, but rather how journalists can find and extract stories from datasets.
데이터 저널리즘은 중대한 국면을 맞이하였습니다. : 만약 이 토론이 지속되어야 한다면, 어떻게 저널리스트들이 데이터세트들에서 이야기를 발췌 할 수 있는 지를 찾아보아야 합니다.

Of course, a dedicated focus on the “how” doesn’t guarantee execution. Stories don’t magically float out of spreadsheets, and data rarely arrives in a pristine form. Data journalism — like all journalism — requires a lot of grunt work.
물론, 이것은 ‘어떻게’ 진행되지 못 할지에 대해서만 초점이 맞추어져 있습니다. 이야기는 마법처럼 spreadsheets 밖으로 나오지 않으며, 데이터가 깔끔하게 오는 것은 드문 일입니다. 데이터 저널리즘은 – 대부분의 저널리즘과 같이 – 힘들고 고통스러운 작업이 많이 요구됩니다.

With that in mind, I got in touch with Simon Rogers, editor of The Guardian’s Datablog and a speaker at next week’s Strata Summit, to discuss the nuts and bolts of data journalism. The Guardian has been at the forefront of data-driven storytelling, so its process warrants attention — and perhaps even full-fledged duplication.
그런 이유로, 나는 The Guardian’s Datablog의 편집자이며, 다음주 있을 Strata Summit의 연설예정인 Simon Rogers와 데이터 저널리즘의 제반 사항에 대해 이야기 하기 위해 연락을 취했습니다. The Guardian사는 데이터기반 스토리텔링의 선두주자이기에 그것이 명백한 복제품임에도 많은 관심을 받고 있습니다.

Our interview follows.
우리의 인터뷰는 다음과 같습니다.

What’s involved in creating a data-centric story?
무엇이 데이터 중심의 이야기를 만드는 것입니까?

Simon Rogers: It’s really 90% perspiration. There’s a whole process to making the data work and getting to a position where you can get stories out of it. It goes like this:
Simon Rogers: 그것은 정말 90 %의 땀입니다. 전체의 프로세스는 데이터를 만들고 스토리에서 어디에 둘 것인지 위치를 잡는 것입니다. 그 과정은 이렇게 진행됩니다.

– We locate the data or receive it from a variety of sources — from breaking news stories, government data, journalists’ research and so on.
– 우리는 데이터 또는 다양한 소스의 폼을 받는 것으로 시작합니다. – 최신 소식 기사, 정부 자료, 저널 리스트의 연구 등등에서.

– We then start looking at what we can do with the data. Do we need to mash it up with another dataset? How can we show changes over time?
– 그리고 난 후 우리는 우리가 데이터로 무엇을 할 수 있는지 보기 시작합니다. 다른 데이터 셋과 섞는 것이 필요한가? 어떻게 하면 시간이 지났음을 보여줄 수 있나?

– Spreadsheets often have to be seriously tidied up — all those extraneous columns and weirdly merged cells really don’t help. And that’s assuming it’s not a PDF, the worst format for data known to humankind.
– 스프레드 시트는 종종 아주 깔끔하게 정리해야 합니다 – 모든 외부 열 및 이상하게 합쳐진 셀은 정말 도움이 되지 않습니다. 그리고, 만약 그것이 PDF가 아니라면, 인류에게 알려진 최악의 데이터 형태입니다.

– Now we’re getting there. Next up we can actually start to perform the calculations that will tell us if there’s a story or not.
– 이제 우리는 슬슬 그곳에 근접해 가려 합니다. 그 다음은 그것에 이야기가 있던 없던 우리가 실제 적으로 작업할 것에 대한 계산을 해야 합니다.

– At the end of that process is the output. Will it be a story or a graphic or a visualisation?  What tools will we use?
해당 프로세스의 끝은 결과물입니다. 결과물을 이야기 또는 그래픽이나 시각화 수 있을까? 어떤 도구를 사용할까?

We’ve actually produced a graphic (of how we make graphics) that shows the process we go through:
우리는 실제로 우리가 어떻게 일을 진행하는지에 대한 그래픽을 제작했습니다.

Partial screenshot of “Data journalism broken down.” Click to see the full graphic.
“데이터 저널리즘이 세분화”의 일부 스크린 샷. 전체 그림을 보려면 클릭하십시오 .

What is the most common mistake data journalists make?
데이터 저널리스트가 만드는 가장 일반적인 실수는 무엇입니까?

Simon Rogers: There’s a tendency to spend months fiddling around with things that are only mildly diverting. It’s so easy to get sidetracked into statistical curiosities rather than telling stories that really matter. It’s much more important to strive to create amazing work that will be remembered. You won’t always succeed, but you will get closer.
Simon Rogers: 가벼운 여흥으로 몇 달을 소비하는 경향이 있습니다. 일반적으로 주제에 벗어나 관심거리가 될만한 부분을 위해 몇 달을 써버리는 경우입니다. 그것은 기억 될 놀라운 작품을 제작하기 위해 분투하는 것으로 훨씬 더 중요합니다. 당신은 항상 성공하진 않지만, 가까이 하게 될 것입니다.

Does data journalism require a team, or is it possible for one person to do all the work?
데이터 저널리즘은 팀을 필요합니까, 아니면 한 사람이 모든 일을 할 수 있습니까?

Simon Rogers: You can go solo. I set up the Datastore and ran it for more than a year on my own. But having a team you can call on is very useful. We have access to people who can scrape sites, people who can work with databases, and graphic designers who can make the results look beautiful. We also work with people out there in the world, bringing their expertise into what we do. With the web, you never have to operate on your own.
Simon Rogers: 당신은 혼자 할 수 있습니다. 나는 데이터 저장소를 설정하고 혼자서 1년 이상을 해왔습니다. 하지만 당신이 함께 할 수 있는 팀이 있는 것은 매우 유용합니다. 우리는 사이트를 스크랩 하는 사람, 데이터베이스를 가지고 작업할 수 있는 사람, 그리고 결과물을 아름답게 만들어줄 그래픽 디자이너와 만날 수 있습니다. 우리는 또한 우리의 일에 그들의 전문 지식을 가지고, 그 곳의 세상에서 일할 것입니다. 웹 사용하면 당신은 혼자 작업하지 않아도 됩니다.

Are the data-driven stories you create updatable?
데이터 기반의 이야기는 업데이트 가능한가요?

Simon Rogers: It’s a constant issue. The clever thing is to try to make stuff either incredibly easy to update or something that happens without having to think too much about it. We aren’t quite there yet, but we’re working on it.
Simon Rogers: 그것은 지속적인 이슈입니다. 업데이트를 놀라울 정도로 쉽게 하거나, 그것에 대해 너무 많이 생각하지 않고 어떻게 뭔가를 만들려고 하는 것은 현명한 일입니다. 우리는 아직 그런 단계가 아니지만 우리는 최선을 다하고 있습니다.

What data tools do you use?
어떤 데이터 도구를 사용합니까?

Simon Rogers: It’s a very personal thing, that. For us it includes: Excel, TextEdit (it’s amazing how many times you just need to work on code or formulas without formatting), Google Fusion Tables, Google Spreadsheets, Timetric, Many Eyes, Adobe Illustrator, and Tableau.
Simon Rogers: 그것은, 아주 개인적인 일입니다. 우리는 다음의 것들을 이용합니다. : Excel, TextEdit (코드 또는 서식 없는 수식에서 얼마나 자주 사용하는 지 모릅니다.), Google Fusion Tables, Google Spreadsheets, Timetric, Many Eyes, Adobe Illustrator, and Tableau.

This interview was edited and condensed.
이 인터뷰는 편집과 요약 되었습니다.

 

This entry was posted in English and tagged , , . Bookmark the permalink.

댓글 남기기