Apr 5, 2011

A spanish stopword list for stemming - Weka Stemming

As I posted last month, I was working on weka stemming. I finally was able to use it, but the problem is that i didn't find a weka-compatible stopword list.
So i made a little program that filtered this stopword list from the Snowball stemmer website. The result is at the end of this post.
Copy and paste into a text file between the comments if you need it in your program! Have fun :-)

 
//beginning of the list - don't copy this line
de
la
que
el
en
y
a
los
del
se
las
por
un
para
con
no
una
su
al
lo
como
más
pero
sus
le
ya
o
este

porque
esta
entre
cuando
muy
sin
sobre
también
me
hasta
hay
donde
quien
desde
todo
nos
durante
todos
uno
les
ni
contra
otros
ese
eso
ante
ellos
e
esto

antes
algunos
qué
unos
yo
otro
otras
otra
él
tanto
esa
estos
mucho
quienes
nada
muchos
cual
poco
ella
estar
estas
algunas
algo
nosotros
mi
mis

te
ti
tu
tus
ellas
nosotras
vosotros
vosotras
os
mío
mía
míos
mías
tuyo
tuya
tuyos
tuyas
suyo
suya
suyos
suyas
nuestro
nuestra
nuestros
nuestras
vuestro
vuestra
vuestros
vuestras
esos
esas
estoy
estás
está
estamos
estáis
están
esté
estés
estemos
estéis
estén
estaré
estarás
estará
estaremos
estaréis
estarán
estaría
estarías
estaríamos
estaríais
estarían
estaba
estabas
estábamos
estabais
estaban
estuve
estuviste
estuvo
estuvimos
estuvisteis
estuvieron
estuviera
estuvieras
estuviéramos
estuvierais
estuvieran
estuviese
estuvieses
estuviésemos
estuvieseis
estuviesen
estando
estado
estada
estados
estadas
estad
he
has
ha
hemos
habéis
han
haya
hayas
hayamos
hayáis
hayan
habré
habrás
habrá
habremos
habréis
habrán
habría
habrías
habríamos
habríais
habrían
había
habías
habíamos
habíais
habían
hube
hubiste
hubo
hubimos
hubisteis
hubieron
hubiera
hubieras
hubiéramos
hubierais
hubieran
hubiese
hubieses
hubiésemos
hubieseis
hubiesen
habiendo
habido
habida
habidos
habidas
soy
eres
es
somos
sois
son
sea
seas
seamos
seáis
sean
seré
serás
será
seremos
seréis
serán
sería
serías
seríamos
seríais
serían
era
eras
éramos
erais
eran
fui
fuiste
fue
fuimos
fuisteis
fueron
fuera
fueras
fuéramos
fuerais
fueran
fuese
fueses
fuésemos
fueseis
fuesen
siendo
sido
tengo
tienes
tiene
tenemos
tenéis
tienen
tenga
tengas
tengamos
tengáis
tengan
tendré
tendrás
tendrá
tendremos
tendréis
tendrán
tendría
tendrías
tendríamos
tendríais
tendrían
tenía
tenías
teníamos
teníais
tenían
tuve
tuviste
tuvo
tuvimos
tuvisteis
tuvieron
tuviera
tuvieras
tuviéramos
tuvierais
tuvieran
tuviese
tuvieses
tuviésemos
tuvieseis
tuviesen
teniendo
tenido
tenida
tenidos
tenidas
tened
//end of list - don't copy this line!

Learning Semantic Web - Ontologies with Protégé and OWL

Lately in our master degree classes we are learning how to create Protégé ontologies.
One of the best tools out there to learn this kind of technólogy is Protégé. It allows to create OWL ontologies in an easy way and also has an inference engine to work with.
I'm actually learning with this tool using the 4.0.2 version of the software. Newer versions are said to have different features than older (that is, new versions aren't always better than old ones). So if you want to start from scratch and learn how to create your own OWL ontology (note: OWL stands for Ontology Web Language) I recommend you this version of the software. For learning purposes I recommend you to follow the famous pizza tutorial for Protégé 4.0. It's about creating a simple yet complete ontology about pizzas. Once you complete it, you should be able to create your own ontology easily.
As a final note, It's also possible to publish your ontology and even connect it with others on the web - making an ontology network!
Good luck with OWL!!! :-)