Personal tools
You are here: Home Collaboratori Cartella di lallo Osservatorio Informazione strutturata
Document Actions

Informazione strutturata

Collegamenti e approfondimenti sulla strutturazione dell'informazione con particolare riferimento al controllo e alla partecipazione civica

osservatorio:Osservatorio
laboratorio:Laboratorio
teoria:Democrazia argomentativa

L'informazione non strutturata è quella che si ottiene (p.es.) con una qualsiasi ricerca di una o più parole in un motore di ricerca come http://www.google.com [1]. Anche quando si può affinare il testo inserito si ottiene un lungo ed indistinto elenco di risultati che è difficile da interpretare. Si può sempre sperare nella serendipità [2].

[1]

esempi:

Parole ricerca Risultati
osservatorio 7.720.000
osservatorio dei cittadini 3.620.000
osservatorio rovereto 417.000
liste "comunità di valle" rovereto 109.000
[2]

Serendipità: "la sensazione che si prova quando si scopre una cosa non cercata e imprevista mentre se ne sta cercando un'altra."

Nella ricerca scientifica: "attitudine, capacità di individuare e valutare correttamente dati o risultati imprevisti rispetto ai presupposti teorici di partenza." Zingarelli, Vocabolario della lingua italiana.

informazione strutturata

http://www.motoricerca.info/news/news-59.html

E' curioso notare come molti siti web i cui contenuti sono estrapolati da database possiedono già le informazioni strutturate (il database stesso) ma che la struttura generalmente si perde in maniera più o meno integrale una volta pubblicate le informazioni sul web, costringendo i motori di ricerca a ricostruire almeno in parte la struttura originaria del database.

http://andreatech.blogspot.com/2006/05/informazione-strutturata-e-non.html

Il successo più evidente della gestione destrutturata delle informazioni è ovviamente google. Se devi cercare qualcosa, inserisci poche parole chiave e quasi sicuramente trovi quanto cerchi. Ma non è il solo... quando devo cercare una mail nella mia mailbox non sfrutto il fatto che le mail sono divise in cartelle specifiche... faccio una ricerca a testo libero.

http://mariotedeschini.blog.kataweb.it/giornalismodaltri/2009/10/26/cercasi-dati-primari-per-informazione-strutturata-ma-attenti-alla-reazione/

Un database è, ovviamente, proprio il contrario di qualsiasi uso “sensazionalistico” del dato: non ci sono titoli, non ci sono dati privilegiati rispetto ad altri, ci sono i dati in quanto tali che ciascuno può - o dovrebbe potere - aggregare secondo personali profili di rilevanza. L’interpretazione è lasciata a chi aggrega e legge il dato (si, lo so, se il database è malfatto o limita la dimensioni della ricerca, anche il dato può esserne influenzato… ma ci siamo capiti, no?).

L’Italia ha urgente bisogno che i giornalisti si concentrino sui dati, che li richiedano, che li raccolgano, che li organizzino. E poi magari si dividano sulla loro interpretazione, che tuttavia dovrà confrontarsi immediatamente anche con l’interpretazione del cittadino/lettore/utente che avrà la stessa identica possibilità di interrogare la base di dati.

Certo occorrerà mettere in conto la reazione di dieci, cento, mille “associazioni dei periti immobiliari” che troveranno sempre una buona ragione per pretedere che l’informazione sia non selezionata e filtrata. In modo, naturalmente, “non sensazionalistico”.

informazione localizzata

http://www.comune.rovereto.tn.it/UploadDocs/794_Ing_Larcher.pdf

http://www.opendcn.org/

http://www.opendcn.org/index.php/it/istanzeopendcn

http://www.progettoe21.it/

http://mantova.progettoe21.it/

http://e21.comune.desenzano.brescia.it/

informazione localizzata strutturata istituzionale

http://maps.police.uk/

http://maps.police.uk/view/city-of-london/

http://www.crimereports.com/

http://www.thisweknow.org/ Explore U.S. Government Data About Your Community

Our mission is to present the information the U.S. government collects about every community. By publishing this data in an easy to understand and consistent manner, we seek to empower citizens to act on what's known.

informazione localizzata strutturata non istituzionale

Esempi di informazione localizzata:

EveryBlock

http://www.everyblock.com/

EveryBlock’s New York City

permessi edili

http://nyc.everyblock.com/building-permits/

quartiere:

http://nyc.everyblock.com/locations/boroughs/manhattan/

http://nyc.everyblock.com/locations/boroughs/manhattan/discussions/

http://chicago.everyblock.com/locations/neighborhoods/hyde-park/#tallermap

http://www.alistapart.com/articles/takecontrolofyourmaps Non usano le mappe di google!

EveryBlock Faq
What can users find on EveryBlock?

We point our readers to four broad categories of local news:

  • Civic information — building permits, crimes, restaurant inspections and more. In many cases, this information is already on the Web but is buried in hard-to-find government databases. In other cases, this information has never been posted online, and we’ve forged relationships with governments to make it available.
  • News articles and blog entries — major newspapers, community weeklies, TV and radio news stations, local specialty publications and local blogs. We do the work of classifying articles by geography, so you can easily find the mainstream media coverage near particular locations.
  • Fun from across the Web — local photos posted to the Flickr photo-sharing site, user reviews of local businesses on Yelp, lost and found postings from Craigslist and more. We figure out the relevant places and point you to location-specific items you might not have known about.
  • Announcements — news, classifieds, upcoming events and whatever else you might want to tell your neighbors. We let you post announcements that target your specific neighborhood.
How is EveryBlock funded?
The site was originally funded by a two-year grant from the Knight Foundation through its Knight News Challenge program. It is now wholly owned by msnbc.com.
Is EveryBlock a non-profit?
No. We’re part of msnbc.com, which is a for-profit news company.
What technologies does EveryBlock use?

Our site uses a stack of open-source software: PostgreSQL, PostGIS and Django. We’re lucky enough to use the Python programming language.

We use Amazon Web Services, specifically EC2, for our server needs.

What can readers NOT find on EveryBlock?
  • We only publish news that’s relevant to the block or neighborhood level. Anything that applies to a larger area (e.g., the entire city, or a New York City borough) is outside the scope of our site.
  • We focus on news, as opposed to static data. On EveryBlock, you’ll find a list of recent restaurant inspections near you, but you won’t find a list of the train stations or schools near you. We’re a news site, not a city directory. Roughly speaking, we’re interested in local data that has a date and a specific location.
  • Our policy is to avoid publishing data that identifies addresses of people, for privacy reasons. Hence, we don’t publish sex offender data, divorce records, etc. The exception to this policy is mainstream news articles; if a newspaper publishes a person’s address, our system will detect the address in the article and link to it.
iLive

http://www.ilive.at/

http://www.wethepeoplewiki.com/wiki/index.php/Main_Page usa Simile-Timeline

http://factcheck.it/2009/10/28/la-trasparenza-pero-dice-lessig/

"Non si può separare il dato nudo dalla complessa catena di livelli di comprensione che l’intepretazione corretta del dato richiede."

esempio di informazione medica strutturata collegata elle definizioni di wikipedia:

http://www.gopubmed.org/web/gopubmed/1?WEB10O00h00100090000

Web semantico

http://it.wikipedia.org/wiki/Web_semantico

http://demo.citizen-dan.org/ Community Indicator Systems

http://demo.citizen-dan.org/about/sample-data

http://demo.citizen-dan.org/about/intro-components

http://docwiki.citizen-dan.org/index.php/Main_Page

http://demo.citizen-dan.org/conStruct/explorer

http://docwiki.citizen-dan.org/index.php/Semantic_Government_Solution_Offering

Combined with an open-world approach, new information can be brought in and incorporated to the framework step-by-step. Perhaps the greatest unknown in an ongoing transition to become a semantic enterprise is how an inherently incremental and building-block approach might alter prior practices and risks across the entire information management spectrum.

Ontologia per la classificazione di informazioni di interesse locale

http://vocab.muni-ontology.org/ MUNI Community Vocabulary Ontology

The MUNI Ontology is a general purpose, open-source and open-collaboration vocabulary and ontology for city, municipal, and local community purposes. The MUNI Ontology is being developed specifically to support this Citizen DAN community and data appliance, though it may be applied to any local community context.

http://www.cybercultura.it/pdf/miscione_semanticweb.pdf

I LIMITI DELLA STRUTTURAZIONE DELL’INFORMAZIONE IN RETE

Pratiche e Semantic Web

Spazi informativi omogenei

Secondo un'enciclopedia cinese evocata da Borges "tutti gli animali si dividono in: a) appartenenti all'Imperatore, b) imbalsamati, c) addomesticati, d) maialini da latte, e) sirene, f) favolosi, g) cani in libertà, h) inclusi nella presente classificazione, i) che si agitano follemente, j) innumerevoli, k) disegnati con un pennello finissimo di pelo di cammello, l) et caetera, m) che fanno l'amore, n) che da lontano sembrano mosche" (citato in Foucault, 1967). Qui più che concentrarsi sullo stupore che può indurre una contiguità incoerente, è interessante vedere che l'aspetto più stridente della tassonomia è l'eterogeneità degli insiemi di referenza delle caratteristiche indicate come rilevanti. Comunemente non ci si trova davanti a una situazione molto differente quando si fanno ricerche in Internet. Conseguentemente ci sono considerevoli pressioni per standardizzare i documenti presenti in Rete, cercando di mantenere la categorizzabilità, non tanto l'ordine empirico, quantomeno perché infattibile.

Il problema è molto sentito, e le soluzioni promettono di risolvere notevoli inconvenienti per gli utenti nonché di permettere lo sviluppo di servizi che facilitino l’allocazione di risorse di ogni genere. Un significativo progetto in questa direzione è il Semantic Web.

Secondo Haraway le scienze della comunicazione e la moderna biologia sono accomunate dalla medesima tendenza a tradurre il mondo in codici; nonostante i ripetuti fallimenti nella ricerca di una lingua perfetta, inseguono un linguaggio universale nel quale ogni resistenza al controllo strumentale sparisca e tutte le eterogeneità possano essere smontate, rimontate, investite e scambiate, a vantaggio di una infinita flessibilità. È qui utile ricordare gli esiti delle ricerche di una lingua perfetta perché solo essa sarebbe il fondamento necessario a una razionalizzazione (e quindi possibile automazione) della comunicazione.

Organizzare la varietà, a priori o a posteriori

Bisogna guardare il Semantic Web da un punto di vista esterno per notare alcuni aspetti che la logicità e la coerenza del progetto non rendono evidenti. Un principiante, ad esempio, nota subito le numerose restrizioni e accorgimenti cui deve prestare attenzione per produrre messaggi conformi alle specifiche del Semantic Web: i concetti non possono essere "meta-espressi" in qualunque maniera, ragionamenti e deduzioni devono usare schemi previamente accettati, le negazioni devono essere chiare e ordinate. Alla domanda sul perché tante limitazioni, la risposta è perché altrimenti i software che su tali formalizzazioni operano non funzionerebbero.

Una volta creato un tassello del Semantic Web, dev'essere condiviso fra la parti in gioco nella comunicazione, affinché effettivamente informi a sé i messaggi. Ciò non significa che una volta definite, le ontologie -per esempio- saranno immutabili: con l'evolversi di un campo metadescritto o delle esigenze ad esso legate, esse devono adeguarsi. Per poter divenire onnipervasiva come si propone, l'evoluzione della rete semantica ha bisogno di essere pubblica, decentrata e aperta (alcune delle ragioni del successo del Web), e ciò comporta compromessi. In particolare bisognerà abbandonare l'ideale della completa consistenza dei dati, cioè non sarà sicuramente possibile ottenere una totale omogeneità poiché ogni cambiamento delle griglie semantiche causa inconsistenze nell'organizzazione dei dati perché attori distinti amministreranno parti diverse del sistema. Il livello di omogeneità raggiunto sarà molto importante per gli esiti effettivi e implicazioni del progetto.

Non si dia però per scontata l'effettiva realizzabilità di insiemi di metamarcatori condivisi, dubbio evidente se per esempio si accetta la teoria di Wittgenstein secondo cui più che per unità sostanziali il linguaggio funziona attraverso giochi linguistici e somiglianze di famiglia. Il significato come uso che se ne fa (e la capacità di farne) rifiuta la concezione tradizionale secondo la quale le parole denotano oggetti o qualità degli oggetti e la lingua altro non è che una nomenclatura. Parole o proposizioni possono assumere significati molto diversi in rapporto ai giochi linguistici in cui sono usate; la teoria dei giochi linguistici dà adito ad una nozione di significato slegata dalle ipoteche ontologiche di rappresentazione, recuperando una dimensione convenzionale e in particolare sociale. Secondo tale prospettiva, il linguaggio riceve la realtà effettiva non tanto da un sistema astratto di forme linguistiche, come presuppone il Semanatic Web, ma dall'essere un evento sociale: la parola è ugualmente determinata da chi è detta e da chi è intesa. L'importanza della situazione entro cui (e grazie a cui) la comunicazione avviene sta nel darle consistenza e riferimenti. La maggioranza dell'informazione prodotta e veicolata sulla Rete, anche se è deterritorializzata e il contesto pare evanescente, non è universale ma intrinsecamente situazionale, a causa del gioco di aspettative fra i parlanti e al contesto intersoggettivo in cui operano.

Nel variegato panorama delle comunità virtuali (newsgroup, mailing list, instant messaging, web-based...) si riscontra come la coesione dipende dalla conformità ai percepiti “corsi naturali d’azione” e la marginalizzazione è molto rapida.

Spesso, la credibilità concessa all’informazione dipende più dall’autorevolezza concessa all’autore, alla fonte o ai pareri altrui che dall’effettivo contenuto.

Con sistemi come Google l’organizzazione delle informazioni in Rete è implicitamente autoregolata dagli stessi utenti (attraverso i loro usi); l'insieme delle relazioni si mantiene dinamico e modificabile. Davanti a tale parallelo si rivela l'insufficiente flessibilità del Semantic Web, che nell'arginare l'incoerenza limita l'indipendenza.

difficile demarcazione fra enciclopedia e comunicazione, cioè fra informazioni che hanno interesse e validità anche al di fuori del contesto in cui vengono enunciate, e quelle che invece lo perdono al di fuori delle proprie circostanze.

Se un'omogeneità comunicativa generalizzata è impossibile, al massimo il Semantic Web potrà permettere isole omogenee di conoscenza in ambiti già circoscritti da una propria omogeneità, per esempio ambiti accademici (soprattutto scientifici), settori di mercato, pubblica amministrazione.

Quattro tipi di comunicazione organizzativa
  • TOP DOWN COMUNICATION (verso il basso) attraverso manuali, indicazioni generali, conferenze
  • BOTTON UP COMUNICATION (verso l’alto) feed back di dati e informazioni, monitoraggio e raccordo tra aree periferiche e dirigenza ( indagini di clima o motivazionali)
  • COMUNICAZIONE ORIZZONTALE (colleghi dello stesso livello e scambio comunicazionale organizzativo)
  • COMUNICAZIONE TRASVERSALE (colleghi di vario livello appartenenti a funzioni diverse per interagire e creare sinergie rispetto alla funzione)

http://www.publicsphereproject.org/drupal/node/13

http://ec.europa.eu/information_society/activities/egovernment/policy/eparticipation/index_en.htm

http://ec.europa.eu/information_society/activities/egovernment/library/reports/docs/european_eparticipation_summary_nov_2009.pdf


Powered by Plone CMS, the Open Source Content Management System

This site conforms to the following standards: