The HEXAnord-HEalth teXt Analysis network in the Nordic and Baltic countries signed today!
The research network that is funded by Norfa (Nordic council) obtained funding for three years. The partners in addition to DSV/KTH-Stockholm University are the Norwegian University of Science and Technology, NTU, the Danish Technical University, DTU, University of Turku, Finland, University of Tartu, Estonia and Vytautas Magnus University, Lithuania. The aim of the network is to construct synthetic patient records for the development and evaluation of textmining tools to be used on real electronic health records as well as give PhD-courses in the area of clinical text mining.
Archive for the ‘Conference outside DSV’ Category
HEXAnord contract signed today!
Thursday, November 11th, 2010ACL-IJCNLP 2009, 2-7 August 2009, Singapore
Thursday, November 11th, 2010Bart Jongejan and I presented our paper with the title Automatic training of lemmatization rules that handle morphological changes in pre-, in- and suffixes alike (pdf) at ACL-IJCNLP 2009, in Singapore.
The ACL-IJCNLP 2009 conference is an international conference but of course most of the 500 participants came from Asia.
Bart obtained some questions and suggestions from Ulf Hermjakob and Eduard Hovy both from University of California/ISI.
After the presentation Bart and Hercules relaxed with a Singapore Sling at Raffles Hotel.
There is always an ACL-disco at the ACL-conferences.
After the disco one needs to get the feet treated by doctor fishes.
In Singapore they are VERY fond of the durian fruit.
and there are also BIG fruit bats.
Next year ACL-2010 will take place in Uppsala Stockholm.
Publication written by EMIS student accepted to MCIS 2009, September 25-27, Athens
Thursday, November 11th, 2010Theodora Zarmpou, a prior EMIS student (2006-2008), got accepted to present a scientific paper, initially done as her Master Thesis in DSV, at the 4th The Mediterranean Conference on Information Systems, MCIS 2009. The thesis work ended up in a publication with the title: Data migration between web content management systems, conducted in cooperation with associate professor Hercules Dalianis and Professor Maro Vlachopoulou (University of Macedonia, Thessaloniki, Greece).
Seminarium – Smartare kunskapssökning i journalen, Karolinska institutet, Huddinge, 13 maj 2009, kl 09.00-10.30
Thursday, November 11th, 2010Tid: Onsdagen 13 maj kl 9-10.30
Plats: CeFam – Alfred Nobels allé 12, Flemingsberg, (rummet bredvid lunchrummet, plan 5)
Smartare kunskapssökning i journalen, Hercules Dalianis, Martin Hassel och Sumithra Velupillai
Vi kommer att beskriva en del av Stockholm EPR-korpus som består av över en miljon patientjournaler från 2 000 kliniker från Stockholm läns landsting, ur ett textlingvistiskt perspektiv. Vidare kommer vi att presentera några
preliminära resultat från experiment utförda på journaltexterna:
1) En annoteringsstandard och guldstandard för att kunna avidentifiera journalerna
2) Automatisk ICD-10 kodtilldelning (och validering av ICD-10 kodtilldelning) av journaltext.
3) Ett utforsknings- och hypotesgenereringsexperiment baserat på textklustringsverktyget Infomat, utförda på journaler från geriatriska kliniker.
Nyheter Centrum för Hälsoinformatik, Karolinska institutet
Planeringsansökan med titeln Avidentifierad PatientKorpus (APK) till Vetenskapsrådet.
Thursday, November 11th, 2010Syftet med planeringsprojektet med titeln Avidentifierad PatientKorpus (APK) är att tillgängliggöra en stor databas med över en miljon patientjournaler från Stockholm från åren 2006, 2007 och 2008 från över 2 000 kliniker från Stockholms läns landsting. Patientjournalerna innehåller både strukturerade data såsom kön, ålder, besökstider, diagnoskoder och läkemedel för patienterna men också löpande fritext, vilket är den största delen av journalen. Journalerna är skrivna på svenska av klinisk personal. Vi kallar denna databas för Stockholm EPR Corpus och det är den största kända databasen i Sverige, och kanske även i världen med patientjournaler. Vi önskar tillgängliggöra Stockholm EPR Corpus till en vidare grupp forskare inom medicin, hälsoinformatik, epidemiologi samt språkteknologi. Inom epidiomologi finns det möjlighet att direkt koppla individer i epidemiologiska register (tex Svenska Barncancerregistret och det Svenska tvillingregistret) med motsvarande patient i en patientjournal, men också att koppla biobanker direkt till klinisk data och på så sätt få ytterligare värdefull information för forskningen. Stockholm EPR-Korpus är också värdefull för språkteknologer som utvecklar så kallade textbrytningsverktyg för att kunna hitta nya och dolda samband mellan symptom, diagnoser, behandling, biverkningar i både den fria texten och i de strukturerade delarna av texten.
Patientjournalerna i Stockholm EPR-Korpus är avidentifierade med avseende på namn och personnummer, men innehåller fortfarande information, bland annat i fritextfältet, som skulle kunna identifiera patienterna. Det är etiskt mycket viktigt att denna information aldrig kommer ut och vi kommer därför att med hjälp av våra avidentifieringsverktyg avidentifiera texten innan Stockholm EPR Corpus görs tillgänglig. En fråga som då automatiskt dyker upp är hur mycket ska avidentifieras för att texterna ska kunna vara användbara samtidigt som vi behåller patientsekretessen detta mått måste räknas fram inom ramen för detta projekt. Vi kommer inom projektets ram även ta fram definitioner och riktlinjer för hur man kan skapa en avidentifierad patientkorpus.
Mina medsökande är Dr. Martin Hassel, Dr. Anette Hulth, Smittskyddsinstitutet och Professor Gunnar Nilsson, Karolinska institutet.
Talk by Amarin Deemagarn, Prince of Songkla University, Phuket Campus, Thailand, Friday, 11-12, April 24, room 7501
Thursday, November 11th, 2010Talk by Amarin Deemagarn, Sign Language processing and Intelligent Multimedia system group, Department of Computer Engineering, Prince of Songkla University, Phuket Campus, Thailand.
1. Speech Interface for Querying Tourism Information
2. Assistive software for hearing disability people (The E-Leaning System for Learning Thai Sign Language)
Paper accepted to ACL-IJCNLP 2009, 2-7 August 2009, Singapore
Thursday, November 11th, 2010The paper Automatic training of lemmatization rules that handle morphological changes in pre-, in- and suffixes alike written by Bart Jongejan, CST University of Copenhagen and Hercules Dalianis was accepted to ACL-IJCNLP 2009,Singapore. Out of 571 valid submissions only 121 were accepted, which gives an acceptance rate of 21%.
Cross language search article accepted to NODALIDA 2009, May 15-16 Odense, Denmark
Thursday, November 11th, 2010The article with the title Using Uplug and SiteSeeker to construct a cross language search engine for Scandinavian has been accepted for presentation at the 17th Nordic Conference of Computational Linguistics (NODALIDA 2009) 15-16 maj, Odense, Denmark. The authors are Hercules Dalianis, Martin Rimka and Viggo Kann from CSC/KTH.
The paper will be posted when camera-ready.
Nordforsk Network application meeting in Åre, March 15-17, 2009
Thursday, November 11th, 2010A group of researchers and PhD-students met in Åre, Sweden to write an application for a research network. We aim to get funding for the HEalth teXt Analysis network in the Nordic and Baltic countries (HEXAnord), for constructing synthetic patient records for the development and evaluation of textmining tools for medical health records.We will also apply for research training courses. The funder is Nordforsk, Nordic council. The applicants came from the Human language technology group, Martin Hassel, Sumithra and Hercules SYSLAB, DSV, Øystein Nytrø, Laura Slaughter and Karen Marie Lyng the Norwegian University of Science and Technology, NTU and Fransisco Roque, the Danish Technical University, DTU. Other involved partners are University of Turku, Finland, University of Tartu, Estonia and Vytautas Magnus University, Lithuania.
GSLT-Retreat, Gullmarsstrand, at the West coast, January 26-28, 2009
Thursday, November 11th, 2010Sumithra Velupillai and Hercules Dalianis participated at the yearly GSLT, Graduate School of Language Technology Retreat. There where over 50 participants at the conference; PhD-students, supervisors and alumni from the whole of Sweden, see here for the conference programme.
DSV/KTH-Stockholm University is part of GSLT. At DSV we have one more GSLT PhD student at DSV namely Atelach Argaw who is supervised by associate professor Lars Asker. Dr. Martin Hassel at DSV is also one of the GSLT supervisors and he is also supervisor of Sumithra.
Sumithra presented two posters, one with title Mixing and Blending Syntactic and Semantic Dependencies. The research was been carried out during a GSLT phd-course in Machine learning together with the PhD students Yvonne Samuelsson, Oscar Täckström, Johan Eklund, Mark Fishel, Mark and Markus Saers. This poster was also presented at the Coling workshop CoNLL, in August 2008.
Hercules presented our patient data corpus, the Stockholm EPR corpus, and some experiments we have carried out on it.
Some photos from the GSLT-Retreat: