SlideShare a Scribd company logo
1 of 35
Обука за отворени податоци
18 и 19 март, 2015
ШТО СЕ ПОДАТОЦИ?
Поставување прашања
● Повеќето луѓе не управуваат со податоци за забава. Тие имаат
приказна што сакаат да ја раскажат или проблем што сакаат
да го решат.
● Прашањето може да биде од каков било тип, почнувајќи од:
„Колку денови во годината се сончеви во мојот град?“, па
сè до прашања како „Како мојата Влада ги троши парите? И
од каде доаѓаат тие пари?“ и „Како здравствените трошоци
влијаат на животниот век?“
Што може да кажеме за нив?
● Топчиња за голф (се користат за
играње голф - класификација)
● Бела боја
● Искористени се
● Сите тие имаат иста, одредена
големина
● Има одреден број топчиња Имаат
одредена парична вредност...
Видови податоци
● Квалитативни податоци се оние што се
однесуваат на квалитетот на нешто: опис по боја,
текстура, опис на искуства и податоци од интервју
– сите претставуваат квалитативни податоци.
● Квантитативни податоци се оние кои се
изразуваат со број. На пример, бројот на голф-
топчиња, нивната големина, цена итн.
Видови податоци
● Одделни податоци: нумерички податоци кои имаат
празнини во нив. На пример, бројот на топчиња.
Може да има само цел број топчиња (не може да
име 0,3 топчиња). Други примери би биле резултати
на испит или број на чевли.
● Континуирани податоци: нумерички податоци со
контиуниран опсег. Може да бидат избројани,
подредени и измерени. Пример: висина, тежина,
температура, количество на шеќер во портокал...
● Категорички податоци: објектот што го
објаснуваме го ставаат под одредена категорија: во
нашиот пример податокот „искористени“ е
категоричен податок (каде категориите би биле:
нови, искористени, скршени итн.)
● Редни податоци: податоци што може да бидат
рангирани (подредени) или бидат изразени преку
скала. Може да бидат избројани и подредени, но не
може да бидат измерени. Пример: скала од 1 до 5
Видови податоци
Категорија Спорт – Голф Категоричен податок
Боја Бела Квалитативен податок
Состојба Користени Категоричен податок
Дијаметар 43 mm Континуиран податок
Цена (по топче) 30 ден. Квантитативен податок
Квиз: видови податоци
Улога: Тапанар
❏ Континуиран податок
❏ Категоричен податок
❏ Квалитативен податок
Година на раѓање: 1963
❏ Квалитативен
❏ Одделен
❏ Континуиран
❏ Категоричен
Име: Елена Игнатова
❏ Квантитативен
❏ Квалитативен
❏ Одделен податок
Големина: M
❏ Реден податок
❏ Категоричен
❏ Континуиран
Висина: 187cm
❏ Одделен
❏ Категоричен
❏ Континуиран
❏ Квалитативен
Дата: 18 март 2015
❏ Одделен
❏ Категоричен
❏ Континуиран
Име Пол Возраст Висина Чувство
Дона Ж 21 190cm Изненадене
Елена Ж 23 167cm Благодарна
Тин М 25 167cm Заинтересиран
Дарко М 22 163cm Релаксиран
Ана Ж 22 156cm Оптимистична
Борис М 36 200cm Избезумен
Владимир М 35 167cm Возбуден
Бане M 24 180cm Нервозен
Милена Ж 29 160cm Многу
возбудена
Неструктурирани наспроти структурирани податоци
Податоци за луѓе
● „Имаме 5 користени топчиња за голф со дијаметар 43 mm и секое чини 30 ден.“
● Неструктуриран податок. Нема одредена структура – реченицата може лесно да
биде променета и не е јасно секој збор на што се однесува.
● Скениран ПДФ и фотографии - пријатни за око, не за машина
● Најчесто употребувани машински читливи формати: JSON, XML, RDF, CSV (Comma
Separated Files)...
Податоци за компјутери
● Некои задачи се лесни за луѓе, комплицирани за компјутерите.
● Пример: Текст претставен како слика.
● Одредена структура = машински читливи.
Концепт: Отворени податоци
Што се отворени податоци?
Отворени податоци се сите информации кои
може да бидат слободно употребувани,
реупотребувани и дистрибуирани од секого,
секаде и за секоја цел.
- OpenDefinition.org
Отворените податоци не се PDF!
● Машински читливи - во формат кој лесно може да биде обработен од
страна на компјутер
● Дигитално ≠ машински читливо
● Машински читливи формати: XML, CSV (comma separated values),
JSON
Отворени податоци и податоци од јавен
карактер НЕ е исто.
Бизнис сектор
...Медиуми
Истражувања
НВО
$
Секој има право на владините податоци!
Услови на споделување
Буџетите не се единствените владини
податоци кои треба/може да бидат
отворени!
Владините податоци НЕ се единствените
отворени податоци!
Кои податоци може да бидат
отворени?
● Административни: Буџети, трошоци, потрошувачка на енергија...
● Демографски: Приходи, возраст, струка...
● Демократски: Податоци од избори, податоци за средби, членови...
● Просторни: Згради на јавни институции, паркови, велосипедски
патеки, автобуски станици...
● Податоци за квалитет на животна средина: квалитет на вода,
воздух, почва...
● Плански: Искористеност на земја, катастарски податоци, барања...
Отворени владини податоци во Македонија
● www.otvorenipodatoci.gov.mk
● Државен завод за статистика
● World Bank
● Народна Банка на РМ
Малку инспирација
Алатки за обработка на
податоци
ScraperWiki [преземање на податоци]
Open Refine [чистење на податоци]
Google Sheets / OpenOffice Calc
[анализирање на податоци]
TileMill [презентирање на податоци]
The Data Hub [споделување на податоци]

More Related Content

More from Metamorphosis

More from Metamorphosis (20)

IPA mehanizam-1
IPA mehanizam-1IPA mehanizam-1
IPA mehanizam-1
 
Techsoup balkans dhe global
Techsoup balkans dhe globalTechsoup balkans dhe global
Techsoup balkans dhe global
 
комуникациска цел или зошто комуницираме
комуникациска цел или зошто комуницирамекомуникациска цел или зошто комуницираме
комуникациска цел или зошто комуницираме
 
Внатрешна комуникација
Внатрешна комуникацијаВнатрешна комуникација
Внатрешна комуникација
 
Целна јавност или кого наговараме
Целна јавност или кого наговарамеЦелна јавност или кого наговараме
Целна јавност или кого наговараме
 
Кризна комуникација
Кризна комуникацијаКризна комуникација
Кризна комуникација
 
Алатки за комуникација со медиумите
Алатки за комуникација со медиумитеАлатки за комуникација со медиумите
Алатки за комуникација со медиумите
 
Управување со настани
Управување со настаниУправување со настани
Управување со настани
 
Начини и алатки за комуникација
Начини и алатки за комуникацијаНачини и алатки за комуникација
Начини и алатки за комуникација
 
Комуникација со медиумите
Комуникација со медиумитеКомуникација со медиумите
Комуникација со медиумите
 
Основи на процесот на планирање на комуницирањето
Основи на процесот на планирање на комуницирањетоОснови на процесот на планирање на комуницирањето
Основи на процесот на планирање на комуницирањето
 
Комуникациски пораки или што соопштуваме
Комуникациски пораки или што соопштувамеКомуникациски пораки или што соопштуваме
Комуникациски пораки или што соопштуваме
 
Совети за подобра презентација
Совети за подобра презентацијаСовети за подобра презентација
Совети за подобра презентација
 
Односи со јавноста поим и потреба
Односи со јавноста поим и потребаОдноси со јавноста поим и потреба
Односи со јавноста поим и потреба
 
Работење во облак – Демо на Office 365 и како да се имплементира
Работење во облак – Демо на Office 365 и како да се имплементираРаботење во облак – Демо на Office 365 и како да се имплементира
Работење во облак – Демо на Office 365 и како да се имплементира
 
Имплементација на Office 365 во СОС Детско Село Македонија - Најдобрите практ...
Имплементација на Office 365 во СОС Детско Село Македонија - Најдобрите практ...Имплементација на Office 365 во СОС Детско Село Македонија - Најдобрите практ...
Имплементација на Office 365 во СОС Детско Село Македонија - Најдобрите практ...
 
Freedom of Expression in the Official Educational Curriculum - Meri Jordanovska
Freedom of Expression in the Official Educational Curriculum - Meri JordanovskaFreedom of Expression in the Official Educational Curriculum - Meri Jordanovska
Freedom of Expression in the Official Educational Curriculum - Meri Jordanovska
 
Правата на децата на интернет - Тамара Ресавска
Правата на децата на интернет - Тамара РесавскаПравата на децата на интернет - Тамара Ресавска
Правата на децата на интернет - Тамара Ресавска
 
Проект „Час по приватност“ - Лилјана Пецова
Проект „Час по приватност“ - Лилјана Пецова Проект „Час по приватност“ - Лилјана Пецова
Проект „Час по приватност“ - Лилјана Пецова
 
Fighting Hate Speech Online - Filip Stojanovski
Fighting Hate Speech Online - Filip StojanovskiFighting Hate Speech Online - Filip Stojanovski
Fighting Hate Speech Online - Filip Stojanovski
 

Податоци и отворени податоци

  • 1. Обука за отворени податоци 18 и 19 март, 2015
  • 4. ● Повеќето луѓе не управуваат со податоци за забава. Тие имаат приказна што сакаат да ја раскажат или проблем што сакаат да го решат. ● Прашањето може да биде од каков било тип, почнувајќи од: „Колку денови во годината се сончеви во мојот град?“, па сè до прашања како „Како мојата Влада ги троши парите? И од каде доаѓаат тие пари?“ и „Како здравствените трошоци влијаат на животниот век?“
  • 5. Што може да кажеме за нив? ● Топчиња за голф (се користат за играње голф - класификација) ● Бела боја ● Искористени се ● Сите тие имаат иста, одредена големина ● Има одреден број топчиња Имаат одредена парична вредност...
  • 6. Видови податоци ● Квалитативни податоци се оние што се однесуваат на квалитетот на нешто: опис по боја, текстура, опис на искуства и податоци од интервју – сите претставуваат квалитативни податоци. ● Квантитативни податоци се оние кои се изразуваат со број. На пример, бројот на голф- топчиња, нивната големина, цена итн.
  • 7. Видови податоци ● Одделни податоци: нумерички податоци кои имаат празнини во нив. На пример, бројот на топчиња. Може да има само цел број топчиња (не може да име 0,3 топчиња). Други примери би биле резултати на испит или број на чевли. ● Континуирани податоци: нумерички податоци со контиуниран опсег. Може да бидат избројани, подредени и измерени. Пример: висина, тежина, температура, количество на шеќер во портокал...
  • 8. ● Категорички податоци: објектот што го објаснуваме го ставаат под одредена категорија: во нашиот пример податокот „искористени“ е категоричен податок (каде категориите би биле: нови, искористени, скршени итн.) ● Редни податоци: податоци што може да бидат рангирани (подредени) или бидат изразени преку скала. Може да бидат избројани и подредени, но не може да бидат измерени. Пример: скала од 1 до 5 Видови податоци
  • 9. Категорија Спорт – Голф Категоричен податок Боја Бела Квалитативен податок Состојба Користени Категоричен податок Дијаметар 43 mm Континуиран податок Цена (по топче) 30 ден. Квантитативен податок
  • 10. Квиз: видови податоци Улога: Тапанар ❏ Континуиран податок ❏ Категоричен податок ❏ Квалитативен податок Година на раѓање: 1963 ❏ Квалитативен ❏ Одделен ❏ Континуиран ❏ Категоричен Име: Елена Игнатова ❏ Квантитативен ❏ Квалитативен ❏ Одделен податок Големина: M ❏ Реден податок ❏ Категоричен ❏ Континуиран Висина: 187cm ❏ Одделен ❏ Категоричен ❏ Континуиран ❏ Квалитативен Дата: 18 март 2015 ❏ Одделен ❏ Категоричен ❏ Континуиран
  • 11. Име Пол Возраст Висина Чувство Дона Ж 21 190cm Изненадене Елена Ж 23 167cm Благодарна Тин М 25 167cm Заинтересиран Дарко М 22 163cm Релаксиран Ана Ж 22 156cm Оптимистична Борис М 36 200cm Избезумен Владимир М 35 167cm Возбуден Бане M 24 180cm Нервозен Милена Ж 29 160cm Многу возбудена
  • 12. Неструктурирани наспроти структурирани податоци Податоци за луѓе ● „Имаме 5 користени топчиња за голф со дијаметар 43 mm и секое чини 30 ден.“ ● Неструктуриран податок. Нема одредена структура – реченицата може лесно да биде променета и не е јасно секој збор на што се однесува. ● Скениран ПДФ и фотографии - пријатни за око, не за машина ● Најчесто употребувани машински читливи формати: JSON, XML, RDF, CSV (Comma Separated Files)... Податоци за компјутери ● Некои задачи се лесни за луѓе, комплицирани за компјутерите. ● Пример: Текст претставен како слика. ● Одредена структура = машински читливи.
  • 14. Што се отворени податоци? Отворени податоци се сите информации кои може да бидат слободно употребувани, реупотребувани и дистрибуирани од секого, секаде и за секоја цел. - OpenDefinition.org
  • 15. Отворените податоци не се PDF! ● Машински читливи - во формат кој лесно може да биде обработен од страна на компјутер ● Дигитално ≠ машински читливо ● Машински читливи формати: XML, CSV (comma separated values), JSON
  • 16. Отворени податоци и податоци од јавен карактер НЕ е исто.
  • 19. Буџетите не се единствените владини податоци кои треба/може да бидат отворени! Владините податоци НЕ се единствените отворени податоци!
  • 20. Кои податоци може да бидат отворени? ● Административни: Буџети, трошоци, потрошувачка на енергија... ● Демографски: Приходи, возраст, струка... ● Демократски: Податоци од избори, податоци за средби, членови... ● Просторни: Згради на јавни институции, паркови, велосипедски патеки, автобуски станици... ● Податоци за квалитет на животна средина: квалитет на вода, воздух, почва... ● Плански: Искористеност на земја, катастарски податоци, барања...
  • 21. Отворени владини податоци во Македонија ● www.otvorenipodatoci.gov.mk ● Државен завод за статистика ● World Bank ● Народна Банка на РМ
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30. Алатки за обработка на податоци
  • 32. Open Refine [чистење на податоци]
  • 33. Google Sheets / OpenOffice Calc [анализирање на податоци]
  • 35. The Data Hub [споделување на податоци]

Editor's Notes

  1. Discrete data is counted, Continuous data is measured Discrete Data Discrete Data can only take certain values. Example: the number of students in a class (you can't have half a student). Continuous Data Continuous Data can take any value (within a range) Examples: A person's height: could be any value (within the range of human heights), not just certain fixed heights, Time in a race: you could even measure it to fractions of a second, A dog's weight, The length of a leaf