AWS FullStack Podcast

Amazon Web Services en FullStackPodcast

AWS FullStack Podcast

Introducción

Desde hace un par de meses he vuelto a escuchar Podcasts, entre ellos algunos de temática de Desarrollo Web y Digital en general.

Hace pocas horas Antonio Pérez @apcano1978 ha publicado un episodio acerca de Amazon Web Services (AWS). Anteriores episodios han sido acerca de Back-end, Front-end y APIs. Precisamente adentrar en temas relacionados a Cloud era una inquietud que surgía, y me alegró saber que Antonio desarrollaría el tema.

Antes de oírlo tome unos apuntes de temas acerca de los cuales me gustaría aprender un poco más: ELB, EC2, S3, containers, RDS, las alternativas como Google Cloud y Kubernetes.

Preámbulo / Contexto

Recuerdo que en el 2012 en una empresa de noticias el área de TI con el que trabajaba tuvo entre otras tareas la de migrar a AWS.

En 2014 al evaluar el rendimiento de un portal de compra de tickets de bus conocí acerca de un trabajo de escalabilidad con AWS que había realizado un amigo y colega.

En 2015 un cliente me comentó que trabajar con AWS implicaría una curva de aprendizaje para dominar diversas tecnología, y que podría comprometer el aprendizaje de nomenclaturas particulares y atarse a una tecnología (a una infraestructura).

Hace unos meses vi una solución e-Commerce que considero que requiere un trabajo de despliegue en AWS. Encontré una guía oficial de AWS para desplegar Magento que se caracterizaba por la modularidad de la infraestructura. Un par de amigos están interesados en certificarse como Amazon Architects. Entonces son varios los factores que elevan mi interés y emoción por atender esta oferta.

Episodio de FullStack Podcast

Enlace al episodio

Comparto mis anotaciones contigo

Importancia

Antonio empieza contándonos que:

  • El 40% de sitios en internet se ejecutan sobre AWS
  • Importantes empresas lo utilizan: Netflix, Airbnb, Adobe, Nike…
  • El 60% de infraestructura gaming corre sobre Amazon.

Pros y Contras

  • Pros: Ahorro, Seguridad
  • Contras: Curva de aprendizaje, Costo de tiempo para gestionar los servicios

Servicio Lightsail

Es un servicio similar a un VPS. Se incluye un manejador del servidor.

Servicios Principales

EC2

  • Servicio de Computing. Machines. Se configuran por Cores (tipo y cantidad) y RAM.
  • Las opciones de RAM van desde 512 MB hasta 32 GB.
  • Las opciones de Cores va desde 1 o 2 cores hasta 96 cores.

S3

  • Almacenamiento: 25, 50, 100 GB. Es configurable y Amazon cobra por lo realmente utilizado.

IAM

  • Users & Permissions. Concepto de Policies.

CloudWatch

  • Alertas de acuerdo a condiciones en niveles de consumo en servicios.

Route53

  • Manejador de DNS.
  • CNAME, TXT, SPF (evitar spam)

Servicios para Desarrolladores

  • CodeCommit (code versioning)
  • CodeStar (task manajer, Jira)
  • Cloud9

Servicios interesantes

CloudFront

  • Ayuda a ahorrar recursos de servidor. Caching.

Lambda

  • Un caso: Pasar un CRON a una forma más eficiente. Como función a partir de un trigger.
  • Otro caso: Al subir imagen en aplicación, almacenarla en 3 formatos/tamaños.

Glacier

  • Almacenamiento barato para backups. Cuesta utilizar el backup (recuperarlo, desplegarlo o descargarlo)

RDS

  • Servidor de BD Relacionales. Con la finalidad de dedicar recursos exclusivos a I/O o R/W a la BD.

SES

  • (Mailer). Me hace recordar a Sendgrid

BeanStalk

  • Aprovisionamiento automático de recursos. A partir de condiciones monitoreadas, disponer el arranque de servicios.

Otro camino

esa palabrita

A post shared by Franco Cedillo (@paracuerdas) on

Cada vez que llegamos juntos al principio de ese camino,

pisamos muy cerca de nuestras propias huellas de días pasados.

Nos fusionamos con la natura y disfrutamos el paso a paso,

sentimos los desniveles, repasamos los aromas.

 

Contemplamos y, a veces, saludamos a nuestros amiguitos.

 

Algunas veces nos hemos apresurado en recorrer hacia el final de este camino,

nunca han faltado las ganas de en ese mismo momento recorrerlo de regreso.

 

La ruta al final tiene más luz.

Aunque a veces ya no son los rayos del sol

sino que somos uno con el camino

y sentimos el presente de la vida que ha recorrido nuestras piedras y tierra

 

 

Arduino y Robótica cerca a Salamanca, Cahuache y Villa Jardín

Hace un tiempo vi como una pequeña academia promocionaba sus cursos de Arduino para niños, recuerdo haber preguntado si allí vendían estos dispositivos Microcontrolador + GPIO

Al tiempo ya no vi el aviso, imagino que no tuvo la acogida suficiente o tal vez se mudaron a un local en algún otro lugar.

Hoy vi un aviso, casi frente a donde estaba esa academia. En la Cuadra 37 de la Avenida Canadá.

Bueno, no dejaré de avisarles que allí anuncia clases diversas el Ingeniero Luis Nolasco (UNI). Teléfono 4373829, Celular 999865515

Anuncian también ofimática dirigida a adultos mayores, talleres para niños a partir de 12 años. Pueden hacer consultas a reparamoscomputadoras@hotmail.com

Las consultas pueden ser también acerca de su anuncio de Inteligencia Artificial, Marketing Digital y hasta el Canvas de Modelo de Negocio.

Trilux 032 Medium de Faber Castell

El Trilux 032 Medium es mi compañero del día a día.

Me gustan los lapiceros “de cristal”, los de cuerpo traslúcido, pues deseo solo tener uno o dos lapiceros y solo reemplazarlos cuando ya su tinta esté por agotarse. Soy de las personas que en general no utilizaría un lapicero de Merchandising, tal como no utilizo ropa, gorros o botellas de merchandising.

Pasé a utilizar el lapicero de tres caras, pues es el agarre que vi se dirigía a niños, y me siento cómodo utilizándolo. Me siento un poco, como un niño, más libre, más feliz.

No solo utilizo bien la computadora, sino que la utilizo muchísimo, así como el smartphone. Sin embargo los trazos a manos me mentalizan, siento que las ideas se conectan con mi cuerpo, con mis manos. Así nosotros mismos nos fusionamos con nuestras creaciones.

¿Por qué no un lapicero punta fina?

Pues el trazo de este Medium es más suave de realizar, y mejor de distinguir con luz artificial.

p en g2, ml, nltk, skds, hs

A post shared by Franco Cedillo (@paracuerdas) on

ahí les compartí el recuerdo de cuando se acabó la tinta de uno de mis triluxes, un azul, sin duda el color que más utilizo

Machine Learning at Coursera: Week 10

Large Scale Machine Learning - cousera machine learning week 10

Large Scale Machine Learning

  • e.g. Census data, Website traffic data
  • Can we train on 1000 examples instead of 100 000 000? Plot
  • If high variance, add more examples
    If high bias, add extra features

Gradient Descent with Large Datasets

  • G.D. = batch gradient descent
  • Stochastic Gradient Descent
  • cost function = cost of theta wrt a specific example (x^i, y^i). Measures how well the hypothesis works on that example.
  • May need to loop over the entire dataset 1-10 times

Mini-Batch Gradient Descent

  • Batch gradient descent: Use all m examples in each iteration
  • Stochastic gradient descent: Use 1 example in each iteration
  • Mini-batch gradient descent: Use b examples in each iteration
  • typical range for b = 2-100 (10 maybe)
  • Mini-batch Gradient Descent allows vectorized implementation
    Can partially parallelize the computation

Advanced Topics

Stochastic G.D. convergence

  • every 1000 iterations we can plot the costs averaged over te last 1000 examples
  • Learning Rate, smaller learning rate means smaller oscillations (plot)
    average over more examples, 5000, may get a smoother curve
  • If curve is increasing, should use smaller learning rate
  • Learning Rate
    alpha = const 1 / ( iterationNumer + const2 )

Online Learning

  • continuous stream of data
  • e.g. 1. shipping service, from origin and destination, optimize the price we offer
    • x = feature vector (price, origin, destination)
      y = if they chose to use our service or not
  • e.g. 2. product search
    • input: “Android phone 1080p camera”
    • we want to offer 10 phones per query
    • learning predicted click through rate (CTR)

Map Reduce and Data Parallelism

  • Hadoop
  • Use local CPU to look at local data
  • Massive data parallelism
  • Free text, unstructured data
  • sentiment analysis
  • NoSQL
  • MongoDB

 

Sources

Machine Learning at Coursera: Week 9

Anomaly Detection

Anomaly_Detection-machine-learning-coursera

Density Estimation

Anomaly Detection

Gaussian distribution

  • e.g. Aircrafts engines features: heat generated, vibration intensity
  • e.g. servers: memory usage, cpu load, cpu load / network traffic

Building Anomaly Detection system
Developing and Evaluating
vs. Supervised Learning
What Features to Use

Multivariate Gaussian Distribution

 

Recommender Systems

Recommender-Systems-machine-learning-coursera

 

Content Based Recommendations

  • r(i, j): 1 if user j has rated movie i
  • y(i, j): rating user j to movie i

Collaborative Filtering

  • Symmetry breaking

Low-rank Matrix Factorization

Machine Learning at Coursera: Week 8

Machine Learning at Coursera: Week 8

Unsupervised Learning & K-means

  • Clustering Algorithms, K-means Algorithm
  • Centroids
  • K-means for non-separated clusters
  • Random initialisation
  • Elbow method

Dimensionality Reduction

  • 2D -> 1D
  • Data Compression to speedup training as well as visualizations of complex datasets
  • Indexes (e.g. GDP, Human Development Index)
  • Principal Component Analysis (PCA), projection
  • Data Preprocesing. Scaling, normalization
  • [U, S, V] = svd(sigma)
  • U = covariance matrix
  • Reconstruction from compressed representation